Лучшая практика для API обнаружения объектов TF для очень больших изображений

API обнаружения объектов Tensorflow предлагает разнообразие моделей. Они обучаются на размере изображения 600x600. Предположим, у меня есть спутниковое изображение размером 6000x4000, и я хочу непрерывно обнаруживать объекты по всему изображению. Как лучше всего адаптировать модель TFODI к этому размеру изображения? Меня не волнует время работы каждого изображения для обнаружения объектов. У меня есть графический процессор с 9 ГБ оперативной памяти. Я знаю, что могу разместить одно изображение 6000x4000 на этом графическом процессоре. Я не уверен, смогу ли я разместить нейронную сеть для обработки изображений такого размера на графическом процессоре. Я могу придумать несколько альтернатив:

  • Чип изображения на блоки 600x600, что рискует потерять функции, которые пересекают блоки, но тогда все должно работать из коробки.

  • Измените размеры изображения в определении модели с 600x600 на 6000x4000. Могу ли я пройти переобучение с контрольно-пропускного пункта Модельного зоопарка или мне придется начинать с нуля, если я это сделаю?

  • Сжать изображение до меньшего размера. Это искажает размеры изображения, а также теряет детализацию. Скажем, на картинке города полученная детализация не позволит различить автомобили и небольшие дома.


person Lars Ericson    schedule 08.06.2018    source источник


Ответы (1)


Вам нужно попробовать с разными размерами и посмотреть, с каким размером во время тренировки у вас не закончится память. Потребление памяти также зависит от того, сколько изображений у вас есть, на которых вы тренируетесь. Из того, что вы описали, вы в конечном итоге будете использовать промежуточный размер изображения.

person Srinivas Bringu    schedule 17.06.2018
comment
Попробуйте сохранить соотношение сторон вместо фиксированного размера. Это должно дать лучшие результаты - person Srinivas Bringu; 23.06.2018