Как CNTK использует идентификаторы последовательностей во время обучения?

Идентификаторы последовательности являются необязательными в текстовом формате CNTK. Мне интересно, как идентификаторы последовательности используются во время обучения. Когда минипакет создается из CNTKTextFormat с идентификаторами последовательности, считается ли строка в CNTKTextFormat одним образцом или все строки с одинаковым идентификатором последовательности вместе считаются одним образцом?


person dragon    schedule 17.01.2017    source источник


Ответы (1)


Если заданы идентификаторы, то все строки с одинаковым идентификатором последовательности вместе образуют один обучающий экземпляр (на жаргоне CNTK: они формируют последовательность, состоящую из выборок).

Если идентификаторы отсутствуют, то каждая строка представляет собой новый обучающий экземпляр (состоящий из последовательности с одним образцом).

person wr.    schedule 17.01.2017
comment
Спасибо. дополнительные вопросы, означает ли учебный пример, что все образцы в одном и том же учебном примере должны идти последовательно и не могут быть разделены или изменить порядок? определяется ли размер мини-пакета количеством выборок или количеством обучающих экземпляров? например, если в последовательности 50 образцов, а размер мини-пакета установлен равным 32, как это работает? - person dragon; 18.01.2017