Обнаружение объектов с помощью TensorFlow

TensorFlow — это бесплатная программная библиотека с открытым исходным кодом для потоков данных и дифференцированного программирования для целого ряда задач. Это символьная математическая библиотека, которая также используется для приложений машинного обучения, таких как нейронные сети.

В этой статье мы узнаем, как проще всего обучать и обнаруживать объекты любого типа. Выполните следующие действия:

Шаг 1: Создайте набор данных

Подготовьте набор данных, сделав снимки (от 200 до 300 на объект) с помощью камеры под разными углами. Убедитесь, что изображение должно быть четким и минимальным по размеру, или вы должны минимизировать размер изображений в килобайтах. Я собираюсь обнаружить часть автомобильного шплинта, где я должен проверить, присутствует ли PIN-код, поэтому прямоугольная коробка сообщит результат как PASS, а если PIN-код отсутствует, то это будет FAIL. Это означает, что я должен обнаружить два объекта. Основная задача — захватить изображения и записать фон с помощью BURNER-BONAZA, как показано ниже.

Шаг 2: Аннотация изображения

Ограничивающий прямоугольник — это наиболее часто используемый метод аннотирования изображения. Он выделяет объект на изображении, чтобы сделать его узнаваемым для машин, обучая их учиться на основе этих данных и давать соответствующий результат. Аннотированные изображения используются в качестве наборов данных в машинном обучении при построении модели на основе ИИ, которая может работать сама по себе, используя процесс глубокого обучения, помогая людям выполнять различные задачи без вмешательства человека.

Используйте LABEL-BOX онлайн-инструмент для процесса аннотирования изображений, куда можно загрузить весь набор данных, установить имена объектов (классификаторы) и прямоугольник для создания XML-файлов в качестве каталогов аннотаций.

Посмотрите мое YouTube Video для процесса аннотации изображений

Шаг 3: Преобразование аннотации изображения в TFrecord

На этом этапе аннотации преобразуются в файлы CSV (train.csv, test.csv), а файлы Csv преобразуются в TFrecord для исправления набора данных и изображения друг с другом для улучшения обучения тензорному потоку.

Загрузите эти файлы python для преобразования xml в csv и csv в Tfrecord.

Чтобы узнать больше, подпишитесь на мой канал YouTube Extrinsic Technology.

Шаг 4: Обучение

Обучение Tensorflow осуществляется с помощью tensorflow-models, где вы должны хранить файлы tfrecord в каталоге LEGACY.

Каталог LEGACY будет иметь предварительно обученные веса SSD_COCO, которые мы будем использовать для обучения нашего объекта, а также для загрузки этого файла конфигурации.

Обучающая команда:

python train.py — logtostderr — train_dir=training/ — pipe_config_path=training/ssd_mobilenet_v1_coco.config

Команда экспорта графика:

python export_inference_graph.py — input_type image_tensor — pipe_config_path training/ssd_mobilenet_v1_coco.config — training_checkpoint_prefix training/model.ckpt-your_number — output_directory имя_модели

Шаг 4. Модель тестирования (образец Android)

После успешного обучения создается файл protobuff(.pb), который состоит из нейронных весов статистических данных. Если объект присутствует перед камерой, файл .pb выполнит статистическую операцию с точки зрения матриц и сгенерирует результат. Вы можете увидеть мою обученную модель в этом видео:

Спасибо,