API обнаружения объектов Tensorflow предлагает разнообразие моделей. Они обучаются на размере изображения 600x600. Предположим, у меня есть спутниковое изображение размером 6000x4000, и я хочу непрерывно обнаруживать объекты по всему изображению. Как лучше всего адаптировать модель TFODI к этому размеру изображения? Меня не волнует время работы каждого изображения для обнаружения объектов. У меня есть графический процессор с 9 ГБ оперативной памяти. Я знаю, что могу разместить одно изображение 6000x4000 на этом графическом процессоре. Я не уверен, смогу ли я разместить нейронную сеть для обработки изображений такого размера на графическом процессоре. Я могу придумать несколько альтернатив:
Чип изображения на блоки 600x600, что рискует потерять функции, которые пересекают блоки, но тогда все должно работать из коробки.
Измените размеры изображения в определении модели с 600x600 на 6000x4000. Могу ли я пройти переобучение с контрольно-пропускного пункта Модельного зоопарка или мне придется начинать с нуля, если я это сделаю?
Сжать изображение до меньшего размера. Это искажает размеры изображения, а также теряет детализацию. Скажем, на картинке города полученная детализация не позволит различить автомобили и небольшие дома.