Открытый набор данных Waymo: предоставление данных об автономном вождении для исследований

Данные - важнейший компонент машинного обучения. Наши автомобили накопили более 10 миллионов автономных миль в 25 городах; Этот богатый и разнообразный практический опыт помог нашим инженерам и исследователям разработать технологию автономного вождения Waymo, а также инновационные модели и алгоритмы.

Сегодня мы приглашаем исследовательское сообщество присоединиться к нам с выпуском Waymo Open Dataset, высококачественного мультимодального набора данных датчиков для автономного вождения. Доступный бесплатно для исследователей на сайте waymo.com/open, он состоит из данных датчиков высокого разрешения, собранных беспилотными транспортными средствами Waymo. Набор данных охватывает широкий спектр сред, от плотных городских центров до пригородных ландшафтов, а также данные, собранные днем ​​и ночью, на рассвете и в сумерках, при солнечном свете и дожде.

Мы считаем, что это один из самых больших, богатых и разнообразных наборов данных об автономных автомобилях, когда-либо выпущенных для исследований.

  • Размер и охват. В этом выпуске представлены данные по 1000 сегментам движения. Каждый сегмент фиксирует 20 секунд непрерывного вождения, что соответствует 200 000 кадров с частотой 10 Гц на датчик. Такие непрерывные кадры дают исследователям возможность разрабатывать модели для отслеживания и прогнозирования поведения других участников дорожного движения.
  • Разнообразные условия вождения. Этот набор данных охватывает плотные городские и пригородные зоны в Фениксе, Аризона, Киркленд, Вашингтон, Маунтин-Вью, Калифорния, и Сан-Франциско, Калифорния, с охватом широкого спектра условий вождения (день и ночь, рассвет и сумерки, солнце и дождь).
  • Обзор 360 ° с высоким разрешением. Каждый сегмент содержит данные датчиков с пяти лидаров Waymo с высоким разрешением и пяти фронтальных и боковых камер.
  • Плотная маркировка: набор данных включает кадры лидара и изображения с тщательно маркированными транспортными средствами, пешеходами, велосипедистами и вывесками, в общей сложности записано 12 миллионов 3D-меток и 1,2 миллиона 2D-меток.
  • Синхронизация камеры и лидара. В Waymo мы работали над трехмерными моделями восприятия, которые объединяют данные с нескольких камер и лидара. Waymo разрабатывает всю нашу автономную систему, включая аппаратное и программное обеспечение, для бесперебойной совместной работы, что включает выбор размещения датчика и высококачественную временную синхронизацию.

Когда дело доходит до исследований в области машинного обучения, наличие доступа к данным может превратить идею в настоящую инновацию. Эти данные могут помочь исследователям в улучшении восприятия 2D и 3D, а также в таких областях, как адаптация предметной области, понимание сцены и прогнозирование поведения. Мы надеемся, что исследовательское сообщество создаст более интересные направления с нашими данными, которые не только помогут сделать беспилотные автомобили более способными, но и повлияют на другие связанные области и приложения, такие как компьютерное зрение и робототехника.

Этот выпуск - только первый шаг, и мы приветствуем отзывы сообщества о том, как сделать наш набор данных еще более эффективным в будущих обновлениях.