Классификация изображений с помощью MobileNet в браузере

Что такое классификация изображений?

Классификация изображений - очень важная задача в глубоком обучении, используемом в обширных областях, и имеет очень высокое удобство использования и масштаб. В повседневной жизни мы сталкиваемся с проблемами классификации изображений в одну или несколько групп. Предположим, вы рассматриваете следующее изображение.

Это футболка. Вы можете узнать ее мгновенно. Это потому, что наш мозг невероятно развит, и он видел такие изображения снова и снова. Но как научить машину выполнять одну и ту же задачу? жизни мы сталкиваемся с огромным количеством таких вещей, и их классификация становится огромной работой и утомительной задачей. В реальной жизни может быть самоуправляемый автомобиль, который требуется для распознавания и распознавания светофоров на дороге и принятия решений. .

Что такое MobileNet?

MobileNet - это модель архитектуры CNN для классификации изображений и Mobile Vision. Существуют также и другие модели, но особенность MobileNet заключается в том, что у него очень меньше вычислительных мощностей для запуска или применения трансферного обучения. Это делает его идеальным для мобильных устройств и встроенных систем. и компьютеры без графического процессора или с низкой вычислительной эффективностью со значительным снижением точности результатов. Он также лучше всего подходит для веб-браузеров, поскольку браузеры имеют ограничения по вычислениям, графической обработке и хранению.

Архитектура MobileNet

Предлагаются мобильные сети для мобильных и встроенных приложений машинного зрения, основанные на оптимизированной архитектуре, использующей разделимые по глубине свертки для построения легких глубоких нейронных сетей.
Представлены два простых глобальных гиперпараметра, которые позволяют эффективно выбирать между задержкой и точностью.

Основной уровень MobileNet - это фильтры с разделением по глубине, называемые «свертка с разделением по глубине». Сетевая структура - еще один фактор повышения производительности. Наконец, можно настроить ширину и разрешение, чтобы найти компромисс между задержкой и точностью.

Свертка с разделением по глубине

Разделимые по глубине свертки, которые представляют собой форму факторизованных сверток, которые факторируют стандартную свертку на глубинную свертку и свертку 1 × 11 × 1, называемую точечной сверткой. В MobileNet глубинная свертка применяет один фильтр к каждому входному каналу. Поточечная свертка затем применяет свертку 1 × 11 × 1, чтобы объединить выходные данные глубинной свертки. На следующем рисунке показана разница между стандартной сверткой и разделимой по глубине сверткой.

Стандартная свертка имеет вычислительную стоимость

Dₖ ⋅ Dₖ ⋅ M ⋅ N ⋅ D_F ⋅ D_F

Стоимость свертки с разделением по глубине

Dₖ ⋅ Dₖ ⋅ M ⋅ D_F ⋅ D_F + M ⋅ N ⋅ D_F ⋅ D_F

Ниже представлена полная многоуровневая структура Mobilenet.

Построение модели классификации изображений в браузере

Создать систему классификации изображений с помощью MobileNet в вашем браузере очень просто. Вам нужно создать следующие файлы в том же каталоге.

Файл index.html для отображения изображения и прогноза в браузере.

2. Файл index.js, содержащий логику загрузки мобильной сети.

3. Папка изображений для хранения локального изображения для прогнозирования. Мы также можем использовать прогнозирование изображения в Интернете. Нам просто нужно вставить адрес изображения в файл index.html в атрибут «src» файла img в теге html. ‹здесь адрес изображения› в приведенном ниже коде.

‹img id =” img ”crossorigin src =” ‹адрес изображения здесь› ”width =” 227 'height = ”227' /›

После связывания всех файлов вам нужно просто открыть файл index.html в любом браузере последней версии. Нажмите кнопку Прогноз. Пример вывода см. На снимке экрана ниже.

В консоли браузера вы можете просмотреть оценку достоверности 3 самых высоких прогнозов.

Надеюсь, вам понравилось читать !! Вы можете поставить ему оценку ❤ или поделиться им. Спасибо! :)

Ссылки на мои статьи: