Данные как масло в эпоху искусственного интеллекта. С развитием автомобильной промышленности и внедрением бизнес-сценариев автономного вождения особое значение приобрели алгоритмы автономного вождения. Для алгоритмов автономного вождения требуется большое количество высококачественных данных. В этой статье я делюсь 10 наборами данных с открытым исходным кодом для моделей автономного вождения.

  1. Набор данных КТТИ

Набор данных KITTI был создан Технологическим институтом Карлсруэ в Германии и Американским технологическим институтом Toyota. Это набор данных оценки алгоритма компьютерного зрения в сценариях автономного вождения. Этот набор данных используется для оценки производительности технологий компьютерного зрения, таких как стерео, оптический поток, визуальная одометрия, обнаружение 3D-объектов и 3D-отслеживание в транспортных средствах.

2. Открытый набор данных Waymo

Открытый набор данных Waymo включает данные, собранные автомобилями Waymo, проехавшими миллионы миль в Фениксе, Аризоне, Киркленде, Вашингтоне, Маунтин-Вью, Калифорнии и Сан-Франциско, и охватывает день и ночь, рассвет и закат, солнечные и дождливые дни в различных городах и данные, собранные во время вождения в пригородных условиях. Выборка данных разделена на 1000 сегментов вождения, и каждый сегмент вождения непрерывно фиксирует 20-секундные данные о вождении с помощью датчиков, установленных на автомобилях Waymo, что эквивалентно захвату 200 000 кадров изображений с помощью камеры с частотой 10 Гц, которая включает 5 настраиваемых версий LiDAR и 5 камер переднего и бокового обзора.

3. Набор данных A2D2

Большой набор данных Audi об автономном вождении A2D2. Этот набор данных предоставляет данные о камерах, LiDAR и шинах транспортных средств, что позволяет разработчикам и исследователям изучать методы объединения мультимодальных датчиков. Набор датчиков включает шесть камер и пять блоков LiDAR для полного охвата на 360 градусов. Данные в основном поступают с улиц Германии, включая изображения RGB, а также соответствующие данные трехмерного облака точек. Записанные данные синхронизируются по времени.

4. Набор данных nuScenes

Набор данных nuScenes — это общедоступный крупномасштабный набор данных для автономного вождения, разработанный командой Motional. Компания Motional стремится обеспечить безопасную, надежную и доступную среду без водителя. Обнародовав некоторые данные, Motional стремится продвигать исследования в области компьютерного зрения и автономного вождения.

5. Набор данных CityScapes

CityScapes — это общедоступный набор данных, совместно выпущенный Лабораторией автономного вождения Mercedes-Benz, Институтом Макса Планка и Дармштадтским технологическим университетом, в котором основное внимание уделяется семантическому пониманию городских уличных сцен. Набор данных содержит 50 разных городов, различные стереоскопические видеофрагменты, записанные на уличных сценах в разное время года и в разные погодные условия. Набор данных Cityscapes имеет два набора критериев оценки: точный и грубый. Первый предоставляет 5000 изображений с четкими аннотациями, второй предоставляет 5000 изображений с четкими аннотациями плюс 20000 изображений с грубыми аннотациями.

6. Набор данных DBB100K

В мае 2018 года лаборатория искусственного интеллекта Университета Беркли (BAIR) выпустила общедоступный набор данных о вождении BDD100K и одновременно разработала систему аннотации изображений. Набор данных BDD100K содержит 100 000 видео высокой четкости, каждое примерно 40 секунд\720p\30 кадров в секунду. Ключевой кадр выбирается на 10-й секунде каждого видео для получения 100 000 изображений (размер изображения: 1280*720) и аннотируется. Среди 100 000 изображений есть изображения различной погоды, сцен и времени, а также изображения высокой четкости и размытые изображения, обладающие характеристиками большого масштаба и разнообразия.

7. Набор данных ApolloCar3D

Набор данных содержит 5 277 изображений вождения и более 60 000 экземпляров автомобилей, где каждый автомобиль оснащен отраслевой 3D-моделью CAD с абсолютными размерами модели и семантически маркированными ключевыми точками. Этот набор данных более чем в 20 раз больше, чем PASCAL3D+ и KITTI (современный).

8. Набор данных Argoverse

Набор данных Argoverse — это набор данных, выпущенный Argo AI, Университетом Карнеги-Меллона и Технологическим институтом Джорджии для поддержки исследований в области 3D-отслеживания и прогнозирования движения для автономных транспортных средств. Набор данных состоит из двух частей: Argoverse 3D Tracking и Argoverse Motion Forecasting.

9. Набор данных H3D-HRI-US

В марте 2019 года Исследовательский институт Honda выпустил свой набор данных об автономном вождении, представляющий собой крупномасштабный объемный трехмерный набор данных для обнаружения и отслеживания нескольких объектов, собранный с помощью 3D-сканеров LiDAR. Он содержит 160 многолюдных и интерактивных дорожных сцен с 1 миллионом помеченных экземпляров в 27 721 кадре. Благодаря уникальному размеру набора данных, богатым аннотациям и сложным сценам H3D объединяется, чтобы вдохновлять на исследования в области обнаружения и отслеживания нескольких объектов в трехмерном пространстве с полным объемным звуком.

10. Набор данных Lyft

Набор данных Lyft в настоящее время является крупнейшим набором данных транспортных агентов. Этот набор данных включает журналы движения автомобилей, велосипедистов, пешеходов и других дорожных агентов, с которыми сталкиваются автономные автопарки, и идеально подходит для обучения моделей прогнозирования движения. В частности, включают: почасовое движение дорожных агентов. (1000+); данные по 23 автомобилям (16 тыс.); аннотации семантических графов (15K).

О Дататанге

Компания Datatang, основанная в 2011 году, является профессиональным поставщиком услуг по обработке данных в области искусственного интеллекта и занимается предоставлением высококачественных обучающих данных и данных для глобальных компаний, занимающихся искусственным интеллектом. Опираясь на собственные ресурсы данных, технические преимущества и интенсивный опыт обработки данных, Datatang предоставляет услуги по обработке данных более чем 1000 компаниям и учреждениям по всему миру.

Если вам нужны услуги передачи данных, свяжитесь с нами: info@datatang.com