Джордж Хотц — основатель comma.ai, компании, которая продает устройство, которое вы устанавливаете в свой автомобиль и которое будет управлять вами. Устройство поддерживает более 50 автомобилей и проехало более 30 миллионов миль. Он использует функции адаптивного круиз-контроля и помощи при движении по полосе и, по сути, взламывает систему, чтобы запустить собственное оборудование для самостоятельного вождения.

Я еще не пробовал. Мой Nissan не поддерживается, хотя меня призывают портировать его на себя.

Мне есть что сказать об этой идее, но пока я просто скажу, что я рад, что такие люди, как Джордж, существуют в этом мире. И идея отделения программного обеспечения беспилотных автомобилей от аппаратного обеспечения имеет большой смысл. Но здесь я расскажу об отрывках из его второго интервью с Лексом Фридманом. Если не указано иное, приведенные ниже цитаты взяты из этого интервью и слегка отредактированы.

Интервью также вдохновило меня на создание приложения, в котором размещаются расшифровки интервью (источник доступен здесь). Полностью прочитать/посмотреть/послушать интервью можно здесь.

Найм парней-епископов

У Comma совершенно другой подход к другим организациям, пытающимся решить проблему беспилотных автомобилей. Вот Фридман, объясняющий традиционный подход к проблеме:

Фридман: … задача вождения — это проблема машинного обучения, и Тесла подходит к ней с многозадачным обучением, когда вы разбиваете задачу вождения на сотни разных задач, и у вас есть эта многоголовая сеть, которая очень хорошо справляется с каждой задачей. И, по-видимому, есть что-то наверху, что сшивает вещи вместе, чтобы принимать управленческие решения, политические решения о том, как вы двигаете машину. В этом есть великолепие, потому что это позволяет вам справиться с каждой задачей, такой как обнаружение полосы движения, обнаружение дорожного знака, обнаружение света...

Вы часто будете видеть подобные изображения, когда речь заходит о самостоятельном вождении.

Общая идея заключается в том, что вы сначала идентифицируете транспортные средства, разметку полосы движения, пешеходов и т. д. Затем вы определяете их скорость или положение во времени. Наконец, вы передаете эту информацию модели принятия решений. Преимущество этого в том, что это более объяснимо, чем черный ящик, и позволяет создавать приятные видеоклипы на презентациях.

На это Хотц отвечает:

Hotz: Если бы вы основали компанию по разработке шахматных программ, вы бы наняли слона?

Хотц утверждает, что полностью автономное вождение, по крайней мере, 5-го уровня, потребует сквозного подхода, а не рассмотрения проблемы как серии более мелких управляемых проблем. Это давний спор в машинном обучении: какой уровень абстракции подходит?

Первоначально исследователи пытались закодировать грамматическую логику в системах обработки естественного языка. Но позже они поняли, что грамматику и правильное использование слов легче вывести из больших наборов данных, чем определить явно. Точно так же современное распознавание лиц не имеет носового и глазного модулей. А MuZero показал, что современная игровая модель начинается без предварительного знания внутренней игровой механики или правил.

Но Хотц признает, что для 5-го уровня это может и не понадобиться.

Фридман: Я имею в виду, что это очень убедительное представление о том, что мы можем изучить задачу от начала до конца, как такое же убедительное представление, которое вы могли бы иметь для разговора на естественном языке. Но я не уверен, потому что одно вы там прокрались, это утверждение, что без такого подхода невозможно получить 5 уровень. Я не знаю, очевидно ли это.

Хотц: Я не знаю, очевидно ли это, я на самом деле не это имел в виду. Я думаю, что гораздо проще получить уровень 5 при сквозном подходе. Я думаю, что другие подходы выполнимы, но масштабы инженерной задачи могут превысить возможности человечества.

Разработка функций

Позже он продолжает критиковать разработку признаков в целом, практику использования знаний предметной области для кодирования более значимого представления состояния:

Хотц: это немного лучшая разработка функций, но по сути это все еще разработка функций. И если что-то из истории ИИ нас чему-то и научило, так это тому, что подходы к проектированию функций всегда будут заменяться и проигрывать от начала до конца. Справедливости ради, я не могу давать обещаний относительно сроков, но могу сказать, что если вы посмотрите на код Stock Fish и код AlphaZero, то увидите, что один намного короче другого. Ну, намного элегантнее. Требовалось намного меньше часов программиста, чтобы написать.

Фридман возражает, что самоуправляемые автомобили почти наверняка сложнее, чем шахматы или что-то еще, что было решено с помощью машинного обучения. Но факт остается фактом: практически все современные модели машинного обучения в сложных областях используют очень легкую абстракцию. Они, конечно, не пытаются организовать процесс принятия решений так сильно, как в сфере беспилотного вождения.

Единственная причина, по которой мы подходим к автономному вождению так иначе, чем к другим областям с точки зрения разработки функций, заключается в том, что мы принципиально недостаточно доверяем процессу в такой важной задаче.

Обучение с подкреплением против контролируемого обучения

Хотц также предпочитает обучение с подкреплением обучению с учителем:

Хотц: это определение, которое мне нравится для обучения с подкреплением по сравнению с обучением с учителем в обучении с учителем. Веса зависят от данных, верно? Но обучение данных с подкреплением зависит от веса.

В обучении с учителем вам дается состояние и результат, и вы пытаетесь создать модель, которая дает вам f(state) = output. Если у вас нет данных, где ваш автомобиль находится в опасной ситуации, модель не будет знать, что делать. Вес (модель) зависит от данных (указывает, что они были выставлены).

Обучение с подкреплением исследует состояние, принимает решения, влияющие на состояние, и исследует последующие состояния. Затем модель периодически оценивает состояния, в которых она находится (например, опасная ситуация), и обучается избегать этих состояний. Данные (указывается, что исследованы) зависят от веса (модели).

Более широкая критика индустрии беспилотного вождения

Хотц более широко критикует индустрию беспилотных автомобилей. Он считает, что есть много продавцов змеиного масла. Такие компании, как Zoox (недавно купленная Amazon за 1,2 миллиарда долларов), обещают обеспечить не только самоуправляемое будущее, но и будущее, созданное с нуля, а также углеродно-нейтральное. Между тем, comma.ai получает более 30 миллионов миль данных от своих пользователей и приносит прибыль благодаря нескольким миллионам продаж и нескольким десяткам инженеров.

Но самая интересная критика касается Waymo и всего рынка беспилотных такси.

Хотц: Я думаю, что продукт, который они создают, не имеет смысла… сравнивайте Waymo с водителем Uber, с водителями Uber быстрее… Мне нравится, когда мой водитель Uber не останавливается до полной остановки на знаке «Стоп». Итак, скажем, Waymos на 20% медленнее, верно? Вы можете возразить, что они будут дешевле, а я утверждаю, что у пользователей уже есть возможность обменять деньги на скорость. Он называется Uber Pool. Я думаю, что это около 15% поездок в пулах убер. Правильно? Пользователи не готовы обменивать деньги на скорость. Таким образом, весь продукт, который они создают, не будет конкурировать с традиционными сетями райдшеринга.

Я думаю, что он немного несправедлив по отношению к Waymo. Конечно, они банальные, но у них явно лучшие технологии. Скорость их расцепления раз в 13 000 миль, примерно раз в 100 миль. И Хотц признает, что побеждает лучшая технология. Проблема в том, что они собрали более 10 миллиардов долларов, и вы никак не сможете исправить этот корабль и удовлетворить тех, кто вложил деньги.

Затем он соединяет рынок беспилотных автомобилей с рынком скутеров:

Хотц: Я думаю, что рынок автономных райдшеринговых транспортных средств четвертого уровня будет очень похож на рынок скутеров, если даже технология появится, и я задаюсь вопросом, кто преуспевает на этом рынке?

Это то, о чем я не подумал. Я купился на рассказ о том, что рынок беспилотных такси перевернет с ног на голову целые районы. Я прикинул, что водитель Uber, вероятно, забирает домой около 50% стоимости проезда, а с самостоятельным вождением вы можете передать значительную часть этих 50% потребителю. И это без учета повышения эффективности, например, изменения дизайна автомобиля и оптимизации маршрутов.

Но также верно и то, что беспилотные автомобили почти наверняка будут значительно медленнее. Я смотрел полные видеоролики о самостоятельном вождении Tesla, и самая распространенная ошибка, которую они совершали, заключалась в том, что они были слишком робкими. Часто водителю приходится нажимать на газ, чтобы машина ехала в разумном темпе.

Однако сравнивать его с Uber Pools немного несправедливо. Основная причина, по которой я не беру бассейны, — это неловкость потенциальной необходимости делить машину с незнакомцем и непредсказуемость. И другим преимуществом поездки без водителя является некоторая конфиденциальность и большая предсказуемость, даже если поездка немного медленнее.

Что касается Waymo, что бы сделал Hotz на посту генерального директора?

Хотц: Я бы вытащил Энтони Левандовски из тюрьмы и поставил бы его во главе компании

Левандовски — бывший исполнительный директор Waymo, который сейчас отбывает 18 месяцев в тюрьме за якобы кражу коммерческой тайны, когда он перешел в Uber. Хотц по-прежнему считает самостоятельное вождение проблемой, которая еще не решена, а Waymo и все эти другие компании в этой области слишком быстро стали банальными и корпоративными:

Хотц: Если у вас хороший доход и вы собрали 10 миллиардов долларов, я понятия не имею. Это просто не работает. Нет, это против всего Кремниевой долины. Где ваш минимально жизнеспособный продукт? Вы знаете, где ваши пользователи? Были ли у вас цифры роста? Это традиционная Силиконовая долина. Почему вы его не применяете? Какие? Думаешь, ты уже слишком большой, чтобы потерпеть неудачу?

Однако он считает, что Тесла находится на правильном пути. Он утверждает, что comma.ai будет отставать от Tesla на 2 или 3 года, и это нормально. Он будет Android для iOS Теслы. Он полагает, что они придут к его сквозной системе. Единственная реальная критика, которую он имеет в отношении Tesla, — это отсутствие реального мониторинга водителя, а не сенсорных датчиков на рулевом колесе.

Но в целом, это было отличное интервью, и я очень рекомендую его. Это открыло мне глаза на столь необходимый скептицизм в отношении рынка беспилотных автомобилей со стороны кого-то, кто действительно работает в этой области. Мне нравится идея отделения программного обеспечения от аппаратного обеспечения, и невероятно, что такой продукт существует сегодня на рынке.

Мне есть что сказать о его интервью, и я, возможно, напишу еще несколько постов на эту тему в будущем.