Компьютерное зрение - одна из самых мощных областей искусственного интеллекта, которая фокусируется на разработке и воспроизведении элементов человеческого глаза, чтобы дать машинам возможность видеть различные объекты, цвета и их особенности в мире.
Проще говоря, мы можем понять компьютерное зрение как процесс обучения машин с помощью обучающих изображений путем создания модели и последующего использования ее для решения реальных жизненных задач. Самый простой пример - это обучение компьютера различать кошку и собаку.
С последнего десятилетия, с увеличением вычислительной мощности и емкости хранилища, произошел значительный прогресс в области глубокого обучения и нейронных сетей, но технология машинного зрения по-прежнему отсутствует повсюду. Мы создали отличные камеры с высоким разрешением, но машины до сих пор не используют их должным образом, чтобы увидеть мир и дать желаемое решение проблем. У нас есть дроны, но они до сих пор не обучены должным образом понимать реальные жизненные проблемы и ситуации. Наши самые умные машины великолепны, но машины все еще отстают в технологиях технического зрения.
Примеры использования компьютерного зрения:
Распознавание лиц. Как следует из названия, компьютерное зрение используется для сопоставления изображений людей с их лицами. Он широко используется во многих областях, таких как распознавание лиц для входа в социальные сети, для выявления преступников и нарушителей закона в видео или с помощью камер, для аутентификации владельцев устройств, отслеживания людей по их фотографиям, а также различными способами государственными органами. .
Отрасль здравоохранения. Компьютерное зрение играет решающую роль в развитии сектора здравоохранения. Его можно использовать для обнаружения различных заболеваний, таких как рак, кожные заболевания и т. Д. Он также используется для автоматизации многих задач, таких как проверка результатов МРТ и рентгеновских снимков.
Самоуправляемые автомобили. Самоуправляемые автомобили используют компьютерное зрение как самую важную технологию, которая помогает им заглядывать в окружающую среду, идентифицируя объекты и выполняя действия при вождении в соответствии с тем, что они видят из окружающей обстановки.
Дополненная реальность (AR): Компьютерное зрение - ключевой фактор, поддерживающий функцию дополненной реальности почти в каждом смартфоне на рынке. Это помогает этим устройствам захватывать окружение и создавать виртуальную среду для наложения различных воображаемых объектов на объекты реального мира.
С чего начать?
Для новичков, которые планируют изучать компьютерное зрение и его основные концепции, я приложил список ресурсов:
- Стэнфордский CS231n: сверточные нейронные сети для визуального распознавания
- Сверточные нейронные сети (курс 4 специализации Deep Learning) - Эндрю нг. Это бесплатный ресурс и очень важный плейлист.
- Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и методы для создания интеллектуальных систем - это одна из лучших книг, которую я бы порекомендовал новичку в области машинного обучения и Глубокое обучение.
Полезные видео TEDx
На TEDx есть переговоры с некоторыми из великих людей с многолетним опытом в своей области, как и компьютерное зрение. Вот список самых популярных видеороликов TEDx, связанных с машинным зрением.