Компьютерное зрение - одна из самых мощных областей искусственного интеллекта, которая фокусируется на разработке и воспроизведении элементов человеческого глаза, чтобы дать машинам возможность видеть различные объекты, цвета и их особенности в мире.

Проще говоря, мы можем понять компьютерное зрение как процесс обучения машин с помощью обучающих изображений путем создания модели и последующего использования ее для решения реальных жизненных задач. Самый простой пример - это обучение компьютера различать кошку и собаку.

С последнего десятилетия, с увеличением вычислительной мощности и емкости хранилища, произошел значительный прогресс в области глубокого обучения и нейронных сетей, но технология машинного зрения по-прежнему отсутствует повсюду. Мы создали отличные камеры с высоким разрешением, но машины до сих пор не используют их должным образом, чтобы увидеть мир и дать желаемое решение проблем. У нас есть дроны, но они до сих пор не обучены должным образом понимать реальные жизненные проблемы и ситуации. Наши самые умные машины великолепны, но машины все еще отстают в технологиях технического зрения.

Примеры использования компьютерного зрения:

Распознавание лиц. Как следует из названия, компьютерное зрение используется для сопоставления изображений людей с их лицами. Он широко используется во многих областях, таких как распознавание лиц для входа в социальные сети, для выявления преступников и нарушителей закона в видео или с помощью камер, для аутентификации владельцев устройств, отслеживания людей по их фотографиям, а также различными способами государственными органами. .

Отрасль здравоохранения. Компьютерное зрение играет решающую роль в развитии сектора здравоохранения. Его можно использовать для обнаружения различных заболеваний, таких как рак, кожные заболевания и т. Д. Он также используется для автоматизации многих задач, таких как проверка результатов МРТ и рентгеновских снимков.

Самоуправляемые автомобили. Самоуправляемые автомобили используют компьютерное зрение как самую важную технологию, которая помогает им заглядывать в окружающую среду, идентифицируя объекты и выполняя действия при вождении в соответствии с тем, что они видят из окружающей обстановки.

Дополненная реальность (AR): Компьютерное зрение - ключевой фактор, поддерживающий функцию дополненной реальности почти в каждом смартфоне на рынке. Это помогает этим устройствам захватывать окружение и создавать виртуальную среду для наложения различных воображаемых объектов на объекты реального мира.

С чего начать?

Для новичков, которые планируют изучать компьютерное зрение и его основные концепции, я приложил список ресурсов:

  1. Стэнфордский CS231n: сверточные нейронные сети для визуального распознавания
  2. Сверточные нейронные сети (курс 4 специализации Deep Learning) - Эндрю нг. Это бесплатный ресурс и очень важный плейлист.
  3. Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow: концепции, инструменты и методы для создания интеллектуальных систем - это одна из лучших книг, которую я бы порекомендовал новичку в области машинного обучения и Глубокое обучение.

Полезные видео TEDx

На TEDx есть переговоры с некоторыми из великих людей с многолетним опытом в своей области, как и компьютерное зрение. Вот список самых популярных видеороликов TEDx, связанных с машинным зрением.

  1. Как мы учим компьютеры понимать картинки. Автор Фей Фей Ли.
  2. Как компьютеры учатся мгновенно распознавать объекты, Джозеф Редмон.
  3. Рост компьютерного зрения: изменение нашего подхода к диагностике заболеваний, Питер Чжу.
  4. Почему большинство визуальных эффектов - отстой, но некоторые не от Рена Вейхмана.