Нет нужды говорить, что небезопасное вождение вызывает больше проблем для общества, чем что-либо другое. Около 1,35 миллиона человек умирают в дорожно-транспортных происшествиях каждый год, в то время как экономика США ежегодно теряет около 800 миллиардов долларов. Шокирующие цифры, не правда ли? Это особенно актуально для молодых водителей, которые только что получили водительские права. Недостаток опыта и самоуверенность ведет к рискованным действиям на дороге. Если вы когда-нибудь пытались поделиться опытом с молодым водителем, вы должны меня почувствовать. Вот типичный разговор:

- Приятель, постарайся держаться подальше от машины перед тобой, хорошо?

- Ой, пожалуйста, не будь как мой папа. Я умею водить.

- Чувак, я только что дал тебе совет, как избежать столкновения.

- Да, спасибо. (саркастически)

Честно говоря, я был на обеих позициях. Когда мой опытный друг научил меня навыкам в дороге, а через несколько лет - наоборот. После нескольких месяцев вождения люди переоценивают свои навыки и недооценивают опасность на дорогах.

Вот еще один случай. Вы вызываете такси или заказываете такси, чтобы отвезти вас домой после выпивки. Глубокая ночь, небольшой дождь, машина чистая, водитель очень вежливый и вроде бы все нормально, не считая того, что водитель слишком резко рулит для такой погоды. Водители редко обращаются к клиентам за советом, как водить машину, а вы предпочитаете этого не делать. Однако водители, как правило, улучшают свои навыки вождения, когда размышляют о своих недостатках. В частном порядке.

Мы в Udrive.ai стремимся сократить количество дорожных столкновений и помочь водителям ездить безопаснее и плавнее. Вдохновленные технологиями автономного вождения в автомобилях, мы используем компьютерное зрение и опыт глубокого обучения для разработки мобильного приложения, которое анализирует модели вождения с помощью камеры смартфона и телематических датчиков. Помощник Udrive AI отслеживает ваши основные модели вождения, а затем, когда вы спрашиваете, показывает вашу статистику и дает вам советы.

Технологии и секреты

С помощью компьютерного зрения и глубоких нейронных сетей мы оцениваем множество параметров, например расстояние до транспортных средств, знаков остановки, полос движения, светофоров, пешеходов и велосипедистов. Помимо искусственного интеллекта, нейронных сетей и других причудливых слов, мы используем ряд классических подходов к компьютерному зрению, чтобы мы могли анализировать захваченные сцены почти в режиме реального времени.

Обнаружение объектов

Мы поиграли с несколькими известными нейронными архитектурами (Faster-RCNN, SSD, DSSD, RetinaNet, YOLO -V3, RefineDet и т. Д.), А также сложные подходы, например DeNet [1] детектор без привязки и NAS FPN [2] который является применение поиска нейронной архитектуры для обнаружения. Поскольку вся вычислительная процедура поддерживается на устройстве, мы выбрали архитектуру одноэтапного обнаружения, которая приближается к реальному времени.

Оценка расстояния

Мы также хотим знать приблизительное расстояние до объекта. Недавнее открытие в самостоятельной оценке глубины с помощью монокуляра [3] показывает значительные улучшения в распознавании. К сожалению, это чрезмерно дорогая архитектура для мобильных устройств.

Устранение неполадок

Вместо использования двух отдельных нейронных сетей для вывода, почему бы не объединить прогнозирование расстояния с обнаружением объектов. Более того, нам не нужно оценивать пиксельное расстояние до всей сцены, поэтому оценка глубины монокуляра кажется излишней при выводе. Но мы можем использовать глубинные сети на этапе обучения.

  • Просматривайте предварительно обученные сетевые изображения средства оценки глубины из набора обучающих данных по обнаружению объектов и извлекайте попиксельные прогнозы глубины для каждого обучающего изображения.
  • Приближаем значения глубины внутри каждого ограничивающего прямоугольника, чтобы мы получили расстояние до каждого ограничивающего прямоугольника, даже если в сцене есть окклюзии и некоторые прямоугольники пересекаются (если на самом деле, немного сложная часть).
  • Обучите наш плавкий детектор «расстояние до объекта».

Поэтому мы объединили две оценки без вычислительных затрат.

Бизнес-приложение

Мы считаем, что сегмент B2B в нашем приложении может быть полезен транспортным и логистическим компаниям, а также службам заказа такси и такси. В последние годы наблюдается огромный рост количества услуг по вызову пассажиров. Помимо известных отраслевых гигантов, есть также несколько компаний, которые занимаются более узкими нишами, например, HopSkipDrive (не сотрудничает с Udrive и не использует наши технологии) - компания, которая занимается транспортировкой детей из дома в школу, пока их родители заняты на работе. Такие компании особенно чувствительны к тому, насколько безопасно действует их водитель. Родители хотят, чтобы их дети приехали благополучно и без проблем.

Приложение Udrive помогает оценить уровень безопасности водителя. Мы отслеживаем соблюдение скоростного режима, светофор и выезд сзади (когда водитель слишком быстро приближается к идущему впереди транспортному средству).

Почему мы считаем, что это нужно людям

Мы были не уверены в коммерческой применимости до недавнего открытия: Uber начал партнерство с Nauto - компанией, которая производит очень похожий продукт, за исключением того, что устанавливает индивидуальное дорогостоящее оборудование. С другой стороны, наша цель - встроить все в смартфон; это устраняет необходимость в дополнительном оборудовании, что позволяет нашим клиентам значительно снизить стоимость заказа.

Как это работает

Водителю необходимо закрепить смартфон на держателе и запустить приложение. Просто как тот! Нет необходимости устанавливать дополнительное оборудование. Водитель может получить доступ к своей статистике из приложения, а менеджер компании через панель управления. Чтобы предотвратить дальнейшие ошибки, водитель может просматривать записи видеодоказательств, чтобы было легче понять, какое именно действие было небезопасным.

Мы постоянно добавляем новые функции и переобучаем нейронные сети, чтобы распознавать больше закономерностей, чтобы люди могли получать исчерпывающую информацию о своих схемах вождения.

Авторы: Юра Василюк, Михаил Баранов и Роман Бура
Редакция статьи: Матвей Баринов

Ссылки:
[1] DeNet: обнаружение объектов в реальном времени без привязки,
«https://arxiv.org/pdf/1703.10295.pdf Настоящ

[2] NAS-FPN: Изучение архитектуры масштабируемой пирамиды функций для обнаружения объектов,
https://arxiv.org/pdf/1904.07392.pdf

[3] Погружаемся в самостоятельную оценку глубины с помощью монокуляра
https://arxiv.org/pdf/1806.01260.pdf