Для успешной интеграции беспилотных автомобилей и другого интеллектуального транспорта в реальный мир необходимо обеспечить безопасность пассажиров и пешеходов. В мире разумных машин восприятие отвечает на вопрос: что меня окружает? Эта ситуационная осведомленность имеет первостепенное значение для безопасной эксплуатации автономных транспортных средств в реальных условиях.

Ученые, работающие в этой области, считают, что роботизированное восприятие является основой для оснащения машин семантическим пониманием мира, чтобы они могли надежно идентифицировать объекты и делать обоснованные прогнозы и действия. Майкл Милфорд, доцент Технологического университета Квинсленда (QUT), является ведущим исследователем робототехники, работающим над улучшением восприятия и многого другого в автономных транспортных средствах, проводя свои исследования на стыке робототехники, нейронауки и компьютерного зрения.

Исследование Майкла моделирует нейронные механизмы в мозге, лежащие в основе таких задач, как навигация и восприятие, с целью разработки новых технологий, уделяя особое внимание сложным областям применения, в которых существующие методы не работают, например всепогодное позиционирование в любое время для автономных транспортных средств.

По мере приближения саммита Машинный интеллект в автономных транспортных средствах в Амстердаме мы поговорили с Майклом, чтобы получить представление о последних достижениях в роботизированном восприятии автономных систем и о предстоящих задачах.

Как вы начали свою работу с автономными системами?

Меня всегда восхищало применение интеллекта в автономных системах, еще со времен учебы в университете. Я думаю, что работа с интеллектуальными системами, которые фактически развертываются и оцениваются на воплощенных системах, таких как автономные роботы и транспортные средства, обеспечивает важную «реальную» проверку здравомыслия, чтобы определить, какие части теории верны, а какие требуют дополнительной работы. Эти идеи могут затем закрыть петлю обратной связи с базовой теорией и помочь улучшить ее еще больше, приближая нас к действительно интеллектуальным автономным системам.

Какие ключевые факторы способствовали недавнему прогрессу в восприятии сложных условий?

С практической стороны, это относительно недавнее осознание всеми основными игроками в этой области того, что автономные транспортные средства представляют собой беспрецедентную коммерческую возможность в огромных масштабах, и связанный с этим приток ресурсов и талантов, которые сейчас работают над достижением значительных успехов в решении таких проблем, как восприятия в сложных условиях.

Датчики, такие как камеры, также быстро совершенствуются, чтобы сделать эту проблему более решаемой. Теперь за пару тысяч долларов можно купить потребительскую камеру, которая видит в темноте лучше, чем вы, и эта технология все еще совершенствуется. Таким образом, некоторые «традиционные» проблемы восприятия, такие как зрение в темноте, в значительной степени решаются с помощью усовершенствованных технологий восприятия.

Затем есть программная и алгоритмическая сторона вещей. Люди очень хорошо справляются со сложными или критическими ситуациями восприятия — и теперь, когда мы собираем такие большие объемы данных с платформ беспилотных автомобилей, мы можем обучать глубокие нейронные сети, чтобы имитировать или даже превосходить возможности человека в этом отношении. Мы работаем в этой области для автономной навигации транспортных средств и представим документ «Возможности глубокого обучения в масштабе для визуального распознавания мест» на Международной конференции IEEE по робототехнике и автоматизации в Сингапуре в следующем месяце.

Какие основные проблемы необходимо решить, чтобы восприятие улучшилось и прогрессировало?

Угловые шкафы — это большое дело. Трудно заставить настоящий автономный автомобиль неоднократно сталкиваться с опасными реальными ситуациями, такими как пешеход, выпрыгивающий перед автомобилем. Так что вместо этого вы должны сделать это формально, используя теоретический подход, или с обширным высокоточным моделированием. Также относительно легко довести надежность автономной системы до 90 или 99%, но решить этот последний 1% крайних случаев оказывается патологически сложно. В стесненных обстоятельствах, таких как движение по шоссе, автономные автомобили 1980-х годов уже были достаточно надежными.

Также отрезвляет тот факт, что вы можете взять беженца из страны, где он видел относительно мало машин и никогда не водил машину, и обучить его, чтобы он стал компетентным водителем в новой стране за короткий промежуток времени. Новый водитель-человек способен всю жизнь изучать физику мира и то, как взаимодействуют вещи в окружающей среде, и быстро адаптировать это к конкретной задаче вождения. Это сильно отличается от подхода, используемого многими интенсивно обучающимися корпорациями и стартапами в области беспилотных автомобилей, которые тренируются, используя данные «миллионов миль». Это не означает, что их подход не сработает, но в некотором смысле он сильно отличается от того, как это делаем мы, люди.

Есть ли какие-либо дополнительные приложения пространственного картографирования и визуального распознавания в автономных системах?

Надежное визуальное распознавание автономных роботов и транспортных средств — это не только навигация. Есть так много других ситуаций — распознавание других транспортных средств, пешеходов, даже распознавание намерений человека по выражению его лица. Распознавание всех этих и многих других ситуаций является критически важной возможностью для автономного вождения. Точное пространственное картографирование также является важным компонентом других основных приложений, таких как мониторинг инфраструктуры. Если вы знаете, где вы находитесь, с точностью до миллиметра (над чем мы работаем в нашей лаборатории), вы сможете точно отслеживать изменения окружающей среды с течением времени, например, отслеживать распространение трещин на дорожном покрытии, планере, корабле. корпус или бетонная стена на промышленном предприятии.

Какие изменения мы можем ожидать в автономных транспортных средствах в ближайшие 5 лет?

Это вопрос на миллион/миллиард/триллион долларов. Я думаю, что ключом к любому прогнозу является признание того, что мы особенно плохо предсказываем влияние технологий и их распространение. Тем не менее, я не вижу причин, по которым у нас не будет тщательно контролируемых парков полностью автономных транспортных средств в центральных городских районах богатых технологически благоприятных западных городов, таких как центр Сан-Франциско. Есть ряд причин, почему это вполне осуществимо.

Во-первых, это прибыльный район с высокой плотностью населения, поэтому вы можете позволить себе, при необходимости, «схитрить» и добавить значительную внешнюю инфраструктуру, чтобы упростить проблему беспилотных автомобилей, например, внешние камеры и внешнюю систему контроля безопасности, которая вмешивается, если бортовые системы автомобиля не реагируют на опасную ситуацию.

Во-вторых, это среда с относительно низкой скоростью, поэтому, даже если автомобили попадут в лужу, вероятное воздействие каждого инцидента будет намного меньше. Автомобиль, сбивающий кого-то на скорости 20 миль в час, с гораздо меньшей вероятностью приведет к смертельному исходу, чем автомобиль, движущийся со скоростью 65 миль в час.

В-третьих, парки райдшеринга можно отключать произвольно, чтобы избежать условий, в которых они могут выйти из строя, например, неблагоприятных погодных условий, таких как снег или сильный дождь. Это боль для потребителя, но тем временем у вас все еще будет райдшеринг, управляемый людьми, чтобы заполнить эти пробелы в покрытии. Это своего рода стратегия стартапов, таких как NuTonomy, которые, вероятно, перенимают до тех пор, пока новые исследования не решат эти проблемы неблагоприятного восприятия.

Какая область машинного обучения вас больше всего волнует за пределами вашей области?

Моя основная страсть — понять, а затем разработать действительно интеллектуальные системы. Я думаю, что глубокое обучение — это захватывающая новая область, которая должна вернуться и стать более интегрированной в вычислительную нейронауку. Когда наши знания о реальных нейронных цепях начнут разрабатывать сложные иерархические глубокие сети (а в мире уже есть несколько проектов, которые уже начинают это делать), именно тогда, я думаю, мы начнем наблюдать сногсшибательные достижения в области интеллекта.

Я также воодушевлен потенциалом совершения прорывов в исследованиях интеллекта в области беспилотных автомобилей. Я занялся исследованиями в области навигационного интеллекта, потому что это реальная задача, позволяющая изучить проблему пространственного интеллекта, и в которой вы можете добиться более быстрого прогресса, чем изучение чего-то более абстрактного. Следующим логическим шагом является вождение автомобиля — более общая, но все же ограниченная сфера, требующая определенной степени истинного интеллекта. Я надеюсь, что мы сможем работать с некоторыми крупными корпорациями и стартапами в этой области, чтобы не только разработать технологию, позволяющую создавать беспилотные автомобили, но и совершить новый прорыв в понимании нашего собственного интеллекта и того, как мы можем воспроизвести его. и улучшить его, чтобы сделать полезные автономные системы.

Узнайте больше о будущем искусственного интеллекта на транспорте на Саммите машинного интеллекта в автономных транспортных средствах в Амстердаме 28–29 июня, который пройдет одновременно с Саммитом машинного интеллекта. Посмотреть дополнительную информацию здесь.

Подтвержденными докладчиками являются Пабло Пуэнте Гильен, исследователь, Toyota Motors; Ян Эрик Солем, соучредитель и генеральный директор Mapillary; Свен Бенке, руководитель группы автономных интеллектуальных систем, Боннский университет; Дамиан Борт, директор Центра компетенций глубокого обучения, DFKI, Джулиан Тогелиус, доцент, Инженерная школа Тандон при Нью-Йоркском университете и другие.

Количество билетов на это мероприятие ограничено. Забронируйте место сейчас.

Мнения, высказанные в этом интервью, могут не совпадать с точкой зрения RE•WORK. В результате некоторые мнения могут даже противоречить взглядам RE•WORK, но публикуются для поощрения дискуссий и всестороннего обмена знаниями, а также для того, чтобы позволить нашему сообществу представить альтернативные точки зрения.