В то время как * мои * проекты глубокого обучения были сосредоточены на скучных темах, таких как обнаружение аномальных закономерностей в неструктурированных наборах текстовых данных, крутые ребята учили дронов летать сами по себе.

Автономность дронов была широко обсуждаемой темой, и поставщики коммерциализировали все виды традиционных методов навигации, таких как GPS, точный расчет, навигация по маякам, и даже более крутые вещи, такие как Bluetooth, Wi-Fi или функция «следуй за мной» с поддержкой сотовой связи.

Я никогда не забуду, как впервые увидел «Звездные войны», коварного дроида-дознавателя IT-O и подумал, что когда-нибудь дроиды будут парить вокруг нас.

Когда вы думаете об автономности дронов, вы сталкиваетесь, по сути, с тем же набором проблем, с которым сталкиваются беспилотные автомобили:

  1. Где я нахожусь в космосе?
  2. Куда мне идти?
  3. Что меня окружает?
  4. Как далеко я наткнусь на что-нибудь?

1 и 2 решены задачи с помощью традиционных технологий. Сочетание GPS, картографии и программного обеспечения для навигации по маршруту и ​​оптимизации позволяет автомобилю практически всегда знать, где он находится и куда должен идти. Сложность аэрофотосъемки немного усложняет эту проблему для дронов, но, наоборот, там меньше вещей, с которыми можно столкнуться.

Что вокруг меня?

Классификация изображений лежит в основе понимания того, где безопасно водить машину или летать, и, к сожалению, может привести к ужасным последствиям, если она реализована с использованием некачественного оборудования или программного обеспечения. Для успешного автономного дрона критически важной задачей становится наличие системы классификации изображений на основе видео в реальном времени. Для того, чтобы следить за лыжником и снимать его по склонам или краям фермерского поля на скорости 20 миль в час, требуется не только быстрая система в реальном времени, но и такая, которая может работать на борту - с ограниченными возможностями камеры, аккумулятора и обработки. Как и любой другой когнитивный процесс, для решения этой проблемы в навигацию с помощью дронов приходит глубокое обучение.

Чтобы понять технологических игроков в этой сфере, я начал с GitHub. Базы кода трассировки на Github показывают, что большинство путей к самолетным проектам ведет к Джозефу Редмону, докторанту Университета Редмонда. Джозеф является создателем Darknet, фреймворка нейронной сети с открытым исходным кодом, написанного на C и CUDA. Вместе со своими соавторами Джозеф опубликовал Y ou Only Look Once: Unified, Real-Time Object Detection, из которого произошел YOLO.

Традиционное обнаружение изображений нейронной сети покрывает изображение множеством различных попыток сопоставления одновременно, причем любые из них с высокими оценками классифицируются. YOLO применяет одну нейронную сеть к изображению и использует обнаружение краев для взвешивания и предсказания того, что находится на изображении. Результатом стал новый тип классификатора изображений, легкий и очень быстрый. Я видел демонстрации использования веб-камеры и классификации десятков изображений, одновременно работающих со скоростью 30 кадров в секунду. Джозеф утверждает, что YOLO может работать со скоростью до 150 кадров в секунду.

Избежание столкновения

Еще одно важное нововведение, которое необходимо решить автономным дронам, - это предотвращение столкновений. Избегание сводится к возможности рассчитывать точные расстояния от объектов и предсказывать их направление.

Вы можете возразить, что определение расстояния - тоже решенная проблема. В конце концов, радар существует всегда, а лидар - это то, как автомобили Google представляют мир вокруг них. Но эти технологии ТЯЖЕЛЫЕ, а дрон должен быть легким.

Учитывая, что у дронов есть бортовые камеры, решение становится одним из способов определения расстояний на видео в режиме реального времени. Здесь мы снова видим много усилий с использованием традиционных алгоритмов. Предприниматель Адриан Розенброк в начале 2015 года опубликовал хороший учебник по теме под названием Найти расстояние от камеры до объекта / маркера с помощью Python и OpenCV », и эта работа основана на исследовании, которое восходит как минимум к 2012 году (возможно, намного дальше). . Но внедрение CNN для решения этой проблемы, похоже, действительно приближается к текущим исследовательским усилиям. Когда я искал, какая команда действительно продвигает искусство обнаружения на расстоянии с помощью глубокого обучения в воздушном форм-факторе, одно имя постоянно всплывало: Pilot.ai.

Собираем все вместе: Pilot.ai

Команда из восьми человек на Pilot.ai продемонстрировала довольно убедительные демонстрации технологии автономных дронов, основанной на фреймворках глубокого обучения. Им удалось продемонстрировать как слежение за объектом в реальном времени, так и идентификацию расстояния в реальном времени с помощью бортовой веб-камеры дрона как с бортовой, так и с внешней обработкой.

Технология «следуй за мной» кажется мне ответвлением YOLO, но оценка расстояния в реальном времени, приведенная ниже, кажется новинкой из моих исследований.

В совокупности вы можете увидеть будущее, в котором все виды машин смогут автономно перемещаться с помощью простых камер и встроенной обработки данных.

Если вы пытаетесь указать, какой из стартапов Кремниевой долины станет следующим, чьи технологии и опыт будут приобретены на миллионы, вы можете прекратить поиск на Pilot.ai. Компания Pilot была основана год назад группой беженцев из Стэнфорда, доктора философии и метамозга. Генеральный директор Джонатан Су одержал победу, поскольку технологии его предыдущей компании были приобретены ebay. Он сотрудничал с двумя инженерами, у каждого из которых был год основания Metamind, чтобы запустить Pilot.

Мы знаем, что команда Metamind провела собственное исследование по распознаванию изображений, но у них не было вектора коммерциализации, и поэтому в начале этого года они были приобретены Salesforce примерно за 35 миллионов долларов. Я предполагаю здесь, но в случае с Pilot я вижу пару агрессивных инженеров, которые хотели коммерциализировать этот вид технологий и нашли в лице Су готового лидера.

Я шокирован тем, что все больше инвесторов Кремниевой долины также не связаны с Су в LinkedIn. Pilot привлек стартовый капитал из Данхуа, что неудивительно, учитывая связь Стэнфордского машинного обучения. И команда Чен / Го в Greylock, по крайней мере, случайно осведомлена, но помимо этого Пилот, кажется, легкий выбор. (Я уверен, что за кулисами происходит многое, о чем я не могу узнать по общедоступным ссылкам.)

Самолётная техника не является основной модой беспилотной техники. И я не ожидаю, что Pilot станет таким же выдающимся приобретением, как Отто. Но если бы я был фирмой серии A, я бы отправил своего партнера выпить кофе с Pilot как можно скорее.