Идентификаторы последовательности являются необязательными в текстовом формате CNTK. Мне интересно, как идентификаторы последовательности используются во время обучения. Когда минипакет создается из CNTKTextFormat с идентификаторами последовательности, считается ли строка в CNTKTextFormat одним образцом или все строки с одинаковым идентификатором последовательности вместе считаются одним образцом?
Как CNTK использует идентификаторы последовательностей во время обучения?
Ответы (1)
Если заданы идентификаторы, то все строки с одинаковым идентификатором последовательности вместе образуют один обучающий экземпляр (на жаргоне CNTK: они формируют последовательность, состоящую из выборок).
Если идентификаторы отсутствуют, то каждая строка представляет собой новый обучающий экземпляр (состоящий из последовательности с одним образцом).
person
wr.
schedule
17.01.2017
Спасибо. дополнительные вопросы, означает ли учебный пример, что все образцы в одном и том же учебном примере должны идти последовательно и не могут быть разделены или изменить порядок? определяется ли размер мини-пакета количеством выборок или количеством обучающих экземпляров? например, если в последовательности 50 образцов, а размер мини-пакета установлен равным 32, как это работает?
- person dragon; 18.01.2017