Попытка обучить MobilenetV2 с изображениями 40x40px - неверные результаты после обучения

Мне нужно классифицировать небольшие изображения по 4 различным категориям, +1 фон для ложного обнаружения.

Во время тренировки потери быстро падают до 0,7, но остаются на этом уровне даже после 800 тыс. шагов. В конце концов, замороженный график, кажется, классифицирует большинство изображений с фоновой меткой.

Я, вероятно, что-то упустил, я подробно опишу шаги, которые я использовал ниже, и любые отзывы приветствуются. Я новичок в tf-slim, так что это может быть очевидная ошибка, может быть, слишком мало образцов? Я не ищу максимальной точности, просто что-то работает для прототипирования.

Исходные материалы можно найти здесь: https://www.dropbox.com/s/k55xoygdzb2efag/TilesDataset.zip?dl=0

Я использовал tensorflow-gpu 1.15.3 на Windows 10.

Я создал набор данных, используя: python ./createTfRecords.py --tfrecord_filename=tilesV2_40 --dataset_dir=.\tilesV2\Tiles_40
Я добавил поставщика набора данных в models-master\research\slim\datasets на основе поставщика цветов.
Я изменил mobilnet_v2.py в models-master\research\slim\nets\mobilenet, изменил num_classes=5 и mobilenet.default_image_size = 40.
Я тренировал сеть с : python ./models-master/research/slim/train_image_classifier.py --model_name "mobilenet_v2" --learning_rate 0.045 --preprocessing_name "inception_v2" --label_smoothing 0.1 --moving_average_decay 0.9999 --batch_size 96 --learning_rate_decay_factor 0.98 --num_epochs_per_decay 2.5 --train_dir ./weight --dataset_name Tiles_40 --dataset_dir .\tilesV2\Tiles_40
Когда я пробую это python .\models-master\research\slim\eval_image_classifier.py --alsologtostderr --checkpoint_path ./weight/model.ckpt-XXX --dataset_dir ./tilesV2/Tiles_40 --dataset_name Tiles_40 --dataset_split_name validation --model_name mobilenet_v2, я получаю eval/Recall_5[1]eval/Accuracy[1]
Затем я экспортирую график с помощью python .\models-master\research\slim\export_inference_graph.py --alsologtostderr --model_name mobilenet_v2 --image_size 40 --output_file .\export\output.pb --dataset_name Tiles_40
И заморозить его с помощью freeze_graph --input_graph .\export\output.pb --input_checkpoint .\weight\model.ckpt-XXX --input_binary true --output_graph .\export\frozen.pb --output_node_names MobilenetV2/Predictions/Reshape_1
Затем я пробую сеть с изображениями из набора данных с python .\label_image.py --graph .\export\frozen.pb --labels .\tilesV2\Tiles_40\labels.txt --image .\tilesV2\Tiles_40\photos\lac\1_1.png --input_layer input --output_layer MobilenetV2/Predictions/Reshape_1. Здесь я получаю неправильную классификацию, например 0:background 0.92839915 2:lac 0.020171663 1:house 0.019106707 3:road 0.01677236 4:start 0.0155500565 для лакового изображения набора данных.

Я попытался изменить depth_multiplier, скорость обучения, обучение на процессоре, удалив --preprocessing_name "inception_v2" из команды обучения. У меня не осталось идей...

Robin D. 19.07.2020 источник

Ответы (1)

arrow_upward
1
arrow_downward

Измените скорость обучения, возможно, начните с обычного выбора 3e-5.

Abhishek Verma 19.07.2020

comment

Спасибо, попробую, я использовал значения оттуда github.com/tensorflow/models/tree/master/research/slim/nets/ moving_average_decay 0.9999 разве это уже не очень низко? (как близко к 1) - Robin D.; 19.07.2020

comment

Если у вас есть возможность сделать некоторую регуляризацию, например, отсев. Я бы предложил также сделать это. А насчет распадов, храните их только по первоначальной команде. Сначала поиграйте со скоростью обучения. Кроме того, я неправильно понял, что на самом деле множитель (1 - f). - Abhishek Verma; 19.07.2020

comment

Если бы вы могли увеличить размер изображения, это тоже было бы здорово. MobileNet использует разрешение 224x224, а размер ваших данных слишком мал. Может быть, попробовать увеличить это также. - Abhishek Verma; 19.07.2020

comment

Что-то было не так со скоростью обучения, она очень быстро упала до очень низкого уровня (например, 1e-30 после 10 000 шагов). Одна проблема устранена, спасибо. Я не могу получить изображения с более высоким разрешением, так как они извлечены из 720x480. Они очень разные (см. примеры на imgur.com/Ex2AFAD). У меня сложилось впечатление, что при индивидуальном обучении я могу использовать нестандартный размер изображения? (Я указал 40 пикселей в описании модели, я пропустил шаг?) - Robin D.; 20.07.2020

comment

Если вы не можете изменить размер, модель должна быть настроена на ваши данные. - Abhishek Verma; 20.07.2020

comment

Получил работу, я сделал более простой набор данных с 2 классами и несколькими изображениями. Скорость обучения была действительно слишком высокой и слишком быстрой, размер пакета, вероятно, был слишком маленьким... Эта статья была полезна: - Robin D.; 22.07.2020

comment

О, и изменения размера изображения в mobilenetv2.py достаточно, чтобы иметь ввод изображения нестандартного размера. - Robin D.; 22.07.2020

Вопросы по теме

Как правильно переопределить недоступный HTML-контент с помощью CSS?
Emacs тормозит и создает 0-байтовые файлы в рабочем каталоге
Скрытое переполнение элементов с переменной высотой?
отправить электронное письмо в качестве параметра в URL-адресе в ошибке Rails
Ханойские башни с использованием списков Prolog
Хранение подписей в кодировке base64 в базе данных
Редактирование CSV-файла — удаление всей строки похожих значений на основе условия VIA Powershell
Как начать новый подсчет, когда значение категориальной переменной изменилось в R
Настройте параметры прокси-сервера HTTP в инструменте командной строки Android
Разбор кода JavaScript в модуле Node.js
Почему в С++ возврат указателя частной переменной разных объектов приводит к ошибке сегментации?
Рассчитать минимальное, максимальное и среднее значение в столбце данных
Как применить несколько фильтров в таблице данных угловых материалов?
Конфигурация конкретного узла в JBoss Clustering
Подчеркивания не считываются компонентом сценария в службах интеграции Microsoft
как настроить struts2 с помощью tomcat и apache с mod_jk?
Как использовать REST API RSA Archer для получения отчета?
JMH: не учитывать время внутреннего метода
Время жизни временного объекта, связанного с константной ссылкой (цепочка методов)
фильтр сканирования по подстроке