За последнее десятилетие произошло много удивительных прорывов в области датчиков, вычислительной мощности и алгоритмов, которые помогли новаторам в области автономных транспортных средств обеспечить автоматизацию 3-го уровня на наших дорогах. Несмотря на весь этот прогресс, предстоит пройти долгий путь, чтобы достичь пятого уровня автономии. Выполнение обещания полностью автономных автомобилей требует преодоления значительных препятствий в обучении, тестировании и сборе данных.

Вот три препятствия, влияющие на разработку автономных транспортных средств:

1. Локальное смещение

В Калифорнии больше пилотных проектов, чем где-либо еще в мире. Департамент транспортных средств Калифорнии утверждает, что в 2019 году беспилотные автомобили преодолели в общей сложности 2,9 миллиона миль. Это намного больше, чем в большинстве других штатов и стран. Однако это также означает, что данные обучения, как правило, смещены в сторону дорог и погодных условий Калифорнии.

Проблема локализованной предвзятости впервые попала в заголовки газет в 2017 году, когда шведскому автопроизводителю Volvo пришлось признать, что его экспериментальные беспилотные автомобили были сбиты с толку кенгуру. В конце концов, в Швеции не так много кенгуру, где Volvo собирала данные и обучала свою систему обнаружения. Испытания в Канберре, Австралия, закончились проблемами, когда прыжки кенгуру не позволили системе точно определить, как далеко кенгуру находились от транспортного средства. В Австралии почти во всех дорожно-транспортных происшествиях, связанных с животными, участвуют кенгуру.

Проблемы возникают не только у животных. Чтобы достичь уровня автоматизации 4, транспортное средство должно быть обучено распознавать каждый объект, с которым оно может столкнуться в своей зоне обслуживания. Автономия уровня 5 требует способности распознавать каждый объект и набор условий в любом месте. Это дает нам представление о том, сколько данных для обучения требуется автомобильному ИИ, что мы рассмотрим в нашей следующей статье.

2. Аннотация данных

Учитывая огромное количество правильно аннотированных данных, необходимых для обучения алгоритмов для автономных транспортных средств, объем требуемой работы ошеломляет. Например, в среднем требуется 800 человеко-часов, чтобы аннотировать всего один час данных LiDAR, радара или видео.

Автоматическая маркировка, которая использует алгоритмы ИИ для обогащения и аннотирования данных, может быть быстрее, но не обеспечивает необходимого уровня точности. Это особенно верно в случае временного трехмерного контента, такого как окружающая среда, записанная и воссозданная с помощью LiDAR и радара. Чтобы обеспечить качество данных для обучения автономных транспортных систем, необходимо, чтобы люди были в курсе всех этапов процесса.

Автоматическая маркировка также менее подходит для обучения ИИ пониманию крайних случаев, которые включают данные, которые трудно классифицировать без опыта человека. А в машинном обучении есть много пограничных случаев. В конце концов, реальные среды намного сложнее и непредсказуемее, чем виртуальные. Без полного понимания крайних случаев автономный автомобиль может стать серьезной угрозой безопасности. Например, у него могут возникнуть проблемы с распознаванием определенных дорожных препятствий или странного поведения, например, пешеход в костюме цыпленка.

3. Дрейф ИИ

Обучение беспилотному ИИ — это одно. Тренировать его точно — это другое. Но это не все; ИИ также постоянно нуждается в новых данных, чтобы поддерживать их актуальность и актуальность. Например, может потребоваться распознавать такие вещи, как новые модели автомобилей и появление скутеров в городах, где работает система ИИ.

Точная маркировка изображений и видео имеет решающее значение на протяжении всего жизненного цикла системы. Более того, независимо от качества исходной маркировки, концепция, известная как дрейф ИИ, является неизбежной без регулярного постоянного переобучения модели машинного обучения.

Дрейф ИИ — это то, что происходит, когда алгоритм со временем теряет точность. Это почти то же самое, как если бы человек научился делать что-то неправильно, а затем закреплял эту ошибку по привычке. Другими словами, ИИ развивается сам по себе, потенциально до такой степени, что он начинает интерпретировать вещи и принимать решения, для которых он изначально не был предназначен.

Дрейф ИИ может показаться довольно серьезным, но его можно смягчить постоянным обучением модели. Активное обучение, которое мы рассмотрим в четвертой и последней статье этой серии, также становится возможным решением для обновления моделей ИИ.

Чтобы плавно преодолевать эти лежачие полицейские, многие группы разработчиков автономных транспортных средств обращаются к аутсорсинговым командам по аннотации данных. CloudFactory помогает новаторам в области автомобилестроения устранять предвзятость, ускорять этапы маркировки данных и обновлять модели с помощью качественных обучающих данных.

Первоначально опубликовано на https://blog.cloudfactory.com.