Формат CSV для ML Vision

Неверное количество столбцов CSV для AUTOML vision и нет документации по правильному формату

Я пытаюсь использовать AutoML для обучения некоторых изображений, которые я аннотировал. Он жалуется, что у меня неправильное количество столбцов в написанном мной CSV (говорит, что должно быть 11, а не 9). Однако все примеры CSV, которые я вижу, состоят из 9 столбцов. Мне кажется, что формат изменился, а документацию не обновляли. Заранее благодарны за Вашу помощь.

Подробности:

Это их пример из их документа:

[set,]image_path[,label,x1,y1,,,x2,y2]
TRAIN,gs://My_Bucket/sample1.jpg,cat,0.125,0.25,,,0.375,0.5
VALIDATE,gs://My_Bucket/sample1.jpg,cat,0.4,0.3,,,0.55,0.55
TEST,gs://My_Bucket/sample1.jpg,dog,0.5,0.675,,,0.75,0.875

Вот строчка из моих тестовых данных:

TRAIN,gs://mytensorflowdata/CanVideo 50.jpg,sodacan,0.378125,0.10138888888888889,,,0.61796875,0.8708333333333333

Я также пробовал без ограничивающих рамок, например:

TRAIN,gs://mytensorflowdata/CanVideo 50.jpg,sodacan

Вот сообщение об ошибке, которое выдает мне AutoML:

Error: gs://mytensorflowdata/labels.csv line 13: Expected 11 columns, but found 3 columns only.

person user1335325    schedule 20.09.2019    source источник


Ответы (1)


Я столкнулся с той же проблемой. Вы правы, что не везде обновляли документацию. Однако на этой странице отображается 11 столбцов: https://cloud.google.com/vision/automl/object-detection/docs/csv-format. Похоже, они добавили возможность предоставить все 4 угла ограничительной рамки. Новый пример:

TRAIN,gs://folder/image1.png,car,0.1,0.1,,,0.3,0.3,,
TRAIN,gs://folder/image1.png,bike,.7,.6,,,.8,.9,,
UNASSIGNED,gs://folder/im2.png,car,0.1,0.1,0.2,0.1,0.2,0.3,0.1,0.3
TEST,gs://folder/im3.png,,,,,,,,,

Итак, вам нужно добавить два пустых столбца в конце вашего документа, например:

TRAIN,gs://mytensorflowdata/CanVideo 50.jpg,sodacan,0.378125,0.10138888888888889,,,0.61796875,0.8708333333333333,,
person Sascha    schedule 13.10.2019