Я только начал работать с Tensorflow, с Caffe было очень практично читать данные эффективным способом, но с Tensorflow я вижу, что мне нужно самому писать процесс загрузки данных, создавать TFRecords, пакетирование, множественные угрозы, обрабатывать эти потоки и т. д. Итак, я начал с примера, inception v3, поскольку они обрабатывают часть данных для чтения. Я новичок в Tensorflow и относительно новичок в Python, поэтому мне кажется, что я не понимаю, что именно происходит с этой частью (я имею в виду, да, он увеличивает размер меток до label_index * no of files-но- почему? Создает ли он одну горячую кодировку для меток? Должны ли мы? Почему она просто не расширяется по длине или файлам, поскольку у каждого файла есть метка? Спасибо.
labels.extend([label_index] * len(filenames))
texts.extend([text] * len(filenames))
filenames.extend(filenames)
Весь код находится здесь: https://github.com/tensorflow/models/tree/master/research/inception
Упомянутая часть находится в data / build_image_data.py и строит набор данных изображений из существующего набора данных в виде изображений, хранящихся в папках (где имя папки - это метка): https://github.com/tensorflow/models/blob/master/research/inception/inception/data/build_image_data.py а>
texts
, я не могу сказать вам, какой смысл в его расширении. Ссылка, которую вы даете, ведет в корень репозитория реализации Inception, который содержит десятки файлов ... - person GPhilo   schedule 30.11.2017