Сделайте дороги безопаснее с помощью компьютерного зрения

Нет нужды говорить, что небезопасное вождение вызывает больше проблем для общества, чем что-либо другое. Около 1,35 миллиона человек умирают в дорожно-транспортных происшествиях каждый год, в то время как экономика США ежегодно теряет около 800 миллиардов долларов. Шокирующие цифры, не правда ли? Это особенно актуально для молодых водителей, которые только что получили водительские права. Недостаток опыта и самоуверенность ведет к рискованным действиям на дороге. Если вы когда-нибудь пытались поделиться опытом с молодым водителем, вы должны меня почувствовать. Вот типичный разговор:

- Приятель, постарайся держаться подальше от машины перед тобой, хорошо?

- Ой, пожалуйста, не будь как мой папа. Я умею водить.

- Чувак, я только что дал тебе совет, как избежать столкновения.

- Да, спасибо. (саркастически)

Честно говоря, я был на обеих позициях. Когда мой опытный друг научил меня навыкам в дороге, а через несколько лет - наоборот. После нескольких месяцев вождения люди переоценивают свои навыки и недооценивают опасность на дорогах.

Вот еще один случай. Вы вызываете такси или заказываете такси, чтобы отвезти вас домой после выпивки. Глубокая ночь, небольшой дождь, машина чистая, водитель очень вежливый и вроде бы все нормально, не считая того, что водитель слишком резко рулит для такой погоды. Водители редко обращаются к клиентам за советом, как водить машину, а вы предпочитаете этого не делать. Однако водители, как правило, улучшают свои навыки вождения, когда размышляют о своих недостатках. В частном порядке.

Мы в Udrive.ai стремимся сократить количество дорожных столкновений и помочь водителям ездить безопаснее и плавнее. Вдохновленные технологиями автономного вождения в автомобилях, мы используем компьютерное зрение и опыт глубокого обучения для разработки мобильного приложения, которое анализирует модели вождения с помощью камеры смартфона и телематических датчиков. Помощник Udrive AI отслеживает ваши основные модели вождения, а затем, когда вы спрашиваете, показывает вашу статистику и дает вам советы.

Технологии и секреты

С помощью компьютерного зрения и глубоких нейронных сетей мы оцениваем множество параметров, например расстояние до транспортных средств, знаков остановки, полос движения, светофоров, пешеходов и велосипедистов. Помимо искусственного интеллекта, нейронных сетей и других причудливых слов, мы используем ряд классических подходов к компьютерному зрению, чтобы мы могли анализировать захваченные сцены почти в режиме реального времени.

Обнаружение объектов

Мы поиграли с несколькими известными нейронными архитектурами (Faster-RCNN, SSD, DSSD, RetinaNet, YOLO -V3, RefineDet и т. Д.), А также сложные подходы, например DeNet [1] детектор без привязки и NAS FPN [2] который является применение поиска нейронной архитектуры для обнаружения. Поскольку вся вычислительная процедура поддерживается на устройстве, мы выбрали архитектуру одноэтапного обнаружения, которая приближается к реальному времени.

Оценка расстояния

Мы также хотим знать приблизительное расстояние до объекта. Недавнее открытие в самостоятельной оценке глубины с помощью монокуляра [3] показывает значительные улучшения в распознавании. К сожалению, это чрезмерно дорогая архитектура для мобильных устройств.

Устранение неполадок

Вместо использования двух отдельных нейронных сетей для вывода, почему бы не объединить прогнозирование расстояния с обнаружением объектов. Более того, нам не нужно оценивать пиксельное расстояние до всей сцены, поэтому оценка глубины монокуляра кажется излишней при выводе. Но мы можем использовать глубинные сети на этапе обучения.

Просматривайте предварительно обученные сетевые изображения средства оценки глубины из набора обучающих данных по обнаружению объектов и извлекайте попиксельные прогнозы глубины для каждого обучающего изображения.
Приближаем значения глубины внутри каждого ограничивающего прямоугольника, чтобы мы получили расстояние до каждого ограничивающего прямоугольника, даже если в сцене есть окклюзии и некоторые прямоугольники пересекаются (если на самом деле, немного сложная часть).
Обучите наш плавкий детектор «расстояние до объекта».

Поэтому мы объединили две оценки без вычислительных затрат.

Бизнес-приложение

Мы считаем, что сегмент B2B в нашем приложении может быть полезен транспортным и логистическим компаниям, а также службам заказа такси и такси. В последние годы наблюдается огромный рост количества услуг по вызову пассажиров. Помимо известных отраслевых гигантов, есть также несколько компаний, которые занимаются более узкими нишами, например, HopSkipDrive (не сотрудничает с Udrive и не использует наши технологии) - компания, которая занимается транспортировкой детей из дома в школу, пока их родители заняты на работе. Такие компании особенно чувствительны к тому, насколько безопасно действует их водитель. Родители хотят, чтобы их дети приехали благополучно и без проблем.

Приложение Udrive помогает оценить уровень безопасности водителя. Мы отслеживаем соблюдение скоростного режима, светофор и выезд сзади (когда водитель слишком быстро приближается к идущему впереди транспортному средству).

Почему мы считаем, что это нужно людям

Мы были не уверены в коммерческой применимости до недавнего открытия: Uber начал партнерство с Nauto - компанией, которая производит очень похожий продукт, за исключением того, что устанавливает индивидуальное дорогостоящее оборудование. С другой стороны, наша цель - встроить все в смартфон; это устраняет необходимость в дополнительном оборудовании, что позволяет нашим клиентам значительно снизить стоимость заказа.

Как это работает

Водителю необходимо закрепить смартфон на держателе и запустить приложение. Просто как тот! Нет необходимости устанавливать дополнительное оборудование. Водитель может получить доступ к своей статистике из приложения, а менеджер компании через панель управления. Чтобы предотвратить дальнейшие ошибки, водитель может просматривать записи видеодоказательств, чтобы было легче понять, какое именно действие было небезопасным.

Мы постоянно добавляем новые функции и переобучаем нейронные сети, чтобы распознавать больше закономерностей, чтобы люди могли получать исчерпывающую информацию о своих схемах вождения.

Авторы: Юра Василюк, Михаил Баранов и Роман Бура
Редакция статьи: Матвей Баринов

Ссылки:
[1] DeNet: обнаружение объектов в реальном времени без привязки,
«https://arxiv.org/pdf/1703.10295.pdf Настоящ

[2] NAS-FPN: Изучение архитектуры масштабируемой пирамиды функций для обнаружения объектов,
https://arxiv.org/pdf/1904.07392.pdf

[3] Погружаемся в самостоятельную оценку глубины с помощью монокуляра
https://arxiv.org/pdf/1806.01260.pdf

Сделайте дороги безопаснее с помощью компьютерного зрения

Вопросы по теме