Что такое классификация изображений?
Классификация изображений - очень важная задача в глубоком обучении, используемом в обширных областях, и имеет очень высокое удобство использования и масштаб. В повседневной жизни мы сталкиваемся с проблемами классификации изображений в одну или несколько групп. Предположим, вы рассматриваете следующее изображение.
Это футболка. Вы можете узнать ее мгновенно. Это потому, что наш мозг невероятно развит, и он видел такие изображения снова и снова. Но как научить машину выполнять одну и ту же задачу? жизни мы сталкиваемся с огромным количеством таких вещей, и их классификация становится огромной работой и утомительной задачей. В реальной жизни может быть самоуправляемый автомобиль, который требуется для распознавания и распознавания светофоров на дороге и принятия решений. .
Что такое MobileNet?
MobileNet - это модель архитектуры CNN для классификации изображений и Mobile Vision. Существуют также и другие модели, но особенность MobileNet заключается в том, что у него очень меньше вычислительных мощностей для запуска или применения трансферного обучения. Это делает его идеальным для мобильных устройств и встроенных систем. и компьютеры без графического процессора или с низкой вычислительной эффективностью со значительным снижением точности результатов. Он также лучше всего подходит для веб-браузеров, поскольку браузеры имеют ограничения по вычислениям, графической обработке и хранению.
Архитектура MobileNet
- Предлагаются мобильные сети для мобильных и встроенных приложений машинного зрения, основанные на оптимизированной архитектуре, использующей разделимые по глубине свертки для построения легких глубоких нейронных сетей.
- Представлены два простых глобальных гиперпараметра, которые позволяют эффективно выбирать между задержкой и точностью.
Основной уровень MobileNet - это фильтры с разделением по глубине, называемые «свертка с разделением по глубине». Сетевая структура - еще один фактор повышения производительности. Наконец, можно настроить ширину и разрешение, чтобы найти компромисс между задержкой и точностью.
Свертка с разделением по глубине
Разделимые по глубине свертки, которые представляют собой форму факторизованных сверток, которые факторируют стандартную свертку на глубинную свертку и свертку 1 × 11 × 1, называемую точечной сверткой. В MobileNet глубинная свертка применяет один фильтр к каждому входному каналу. Поточечная свертка затем применяет свертку 1 × 11 × 1, чтобы объединить выходные данные глубинной свертки. На следующем рисунке показана разница между стандартной сверткой и разделимой по глубине сверткой.
Стандартная свертка имеет вычислительную стоимость
Dₖ ⋅ Dₖ ⋅ M ⋅ N ⋅ D_F ⋅ D_F
Стоимость свертки с разделением по глубине
Dₖ ⋅ Dₖ ⋅ M ⋅ D_F ⋅ D_F + M ⋅ N ⋅ D_F ⋅ D_F
Ниже представлена полная многоуровневая структура Mobilenet.
Построение модели классификации изображений в браузере
Создать систему классификации изображений с помощью MobileNet в вашем браузере очень просто. Вам нужно создать следующие файлы в том же каталоге.
- Файл index.html для отображения изображения и прогноза в браузере.
2. Файл index.js, содержащий логику загрузки мобильной сети.
3. Папка изображений для хранения локального изображения для прогнозирования. Мы также можем использовать прогнозирование изображения в Интернете. Нам просто нужно вставить адрес изображения в файл index.html в атрибут «src» файла img в теге html. ‹здесь адрес изображения› в приведенном ниже коде.
‹img id =” img ”crossorigin src =” ‹адрес изображения здесь› ”width =” 227 'height = ”227' /›
После связывания всех файлов вам нужно просто открыть файл index.html в любом браузере последней версии. Нажмите кнопку Прогноз. Пример вывода см. На снимке экрана ниже.
В консоли браузера вы можете просмотреть оценку достоверности 3 самых высоких прогнозов.
Надеюсь, вам понравилось читать !! Вы можете поставить ему оценку ❤ или поделиться им. Спасибо! :)
Ссылки на мои статьи: