Классификация изображений-компьютерное зрение

*********работа в процессе*******

Классификация изображений определяет задачу классификации изображения из фиксированного набора категорий. Обнаружение объектов и сегментация изображений также могут быть сведены к классификации изображений.

В этом проекте я начинаю с изучения набора данных, получая полезную информацию о данных, которая будет использоваться позже в процессе моделирования, после чего следует предварительная обработка, которая преобразует изображения в ценные входные данные для алгоритмов обучения. Наконец, кратко объясняется реализация методов машинного обучения для классификации изображений.

Алгоритмы машинного обучения, используемые для классификации изображений:

K-ближайший сосед (KNN), машины опорных векторов (SVM), многослойный персептрон (MNP) и сверточные нейронные сети (CNN).

2. Набор данных

Набор данных COCO, спонсируемый Microsoft, содержит крупномасштабный набор данных для обнаружения, сегментации и подписи объектов. Этот набор данных содержит изображения, метки и ограничивающие рамки.

COCO определяет 91 класс, но данные используют только 80 классов, а некоторые изображения не имеют аннотаций. Доступны две версии COCO. В этом проекте я выбрал проверочный набор данных 2017 года, который содержит около 5000 изображений.

С помощью COCO API было обнаружено, что большинство изображений имеют более одного объекта с аннотациями для одной или разных категорий. Это приводит к использованию этого свойства путем обрезки объектов с использованием аннотации ограничительных рамок и рассмотрения их как независимых изображений, чтобы преодолеть проблему с несколькими классами в одной и той же проблеме изображения, чтобы мы могли кормить модели изображением одного класса, что упрощает классифицировать. В результате количество изображений увеличилось более чем в 20 раз, как показано на диаграмме ниже.

Полный код этого проекта можно найти здесь:

Классификация изображений-компьютерное зрение

Вопросы по теме