Вице-президент Amazon по Alexa рассказывает о машинном обучении, чат-ботах и ​​о том, выделяет ли промышленность талант ИИ из академических кругов.

В Игре престолов соревновании искусственного интеллекта между домами Amazon, Apple, Facebook, Google и Microsoft, компания, которая наиболее сдержанно говорит о своих технологиях, обычно была тот, который доставляет самолеты с товарами потребителям, размещает тысячи компаний в своих центрах обработки данных, имеет зеленый свет Catastrophe и имеет популярный продукт, который отвечает на вопросы, воспроизводит музыку и около 4998 других вещей. . Да, в течение некоторого времени Amazon была еще более скрыта, чем знаменитая секретная компания Apple, которая открыла свои программы машинного обучения в начале этого года. Однако в последнее время главный научный сотрудник Amazon и вице-президент Alexa Рохит Прасад публично выступил с речью, аргументируя успехи своей компании в распознавании голоса и понимании естественного языка. Alexa, конечно же, является платформой для общения, которая поддерживает вышеупомянутый хитовый продукт Echo.

Сегодня Prasad выступает с речью Alexa Состояние Союза на конференции Amazon Web Services в Лас-Вегасе, анонсируя улучшенную версию Alexa Skills Kit, которая помогает разработчикам создавать эквиваленты приложений для платформы; усовершенствованная голосовая служба Alexa, которая упростит преобразование сторонних устройств, таких как холодильники и автомобили, в ботов Alexa; партнерство с Intel; и Alexa Accelerator, который вместе с инкубатором стартапов Techstars запустит 13-недельную программу, чтобы помочь новичкам развить навыки работы с Alexa. Prasad и Amazon не раскрывают данных о продажах, но, по оценкам отраслевых экспертов, на данный момент Amazon продала более пяти миллионов устройств Echo.

Прасад, который присоединился к Amazon в 2013 году, провел некоторое время с Backchannel перед своим сегодняшним выступлением, чтобы осветить направление Alexa и обсудить, как он набирает сотрудников в арсенал Джеффа Безоса, не пересыхая при этом конвейер AI. Это интервью отредактировано для большей ясности.

Стивен Леви: Вы вице-президент Alexa. Расскажите, как обстоят дела с этим в 2016 году.

Рохит Прасад: Мы в восторге от того, где обстоят дела. Мы выполнили несколько запусков устройств, а также расширили свою деятельность на международном уровне. И мы добились огромного прогресса в обучении Alexa, чтобы лучше понимать вас, как с точки зрения площади, которую охватывает Alexa, так и с точки зрения точности поисковых материалов. Например, подумайте о музыке как о сфере: у нас есть новые возможности [для] того, чтобы вы [могли] искать или воспроизводить песню на основе ее текста. И, наконец, скорость, с которой развиваются сторонние навыки. Раньше в этом году у нас было всего несколько сотен, а теперь мы находимся в диапазоне 5000.

Каковы общие устремления к платформе Alexa? Наши эхо - это то, с чем мы должны разговаривать или с чем должны разговаривать?

Alexa уже предоставляет большой набор утилит и возможностей, в которых несколько однократных намерений работают с очень высокой точностью. Что касается разговорного аспекта, я думаю, что есть много компромиссов в том, чтобы делать это правильно. Алекса не должна возвращаться и задавать вам [ненужные] вопросы. Это было бы очень неприятно. Но Алекса всегда должна задавать вопрос, когда это необходимо, и умение разговаривать также очень важно. Вы знаете о конкурсе Alexa Prize?

Это вызов на 2,5 миллиона долларов для студентов, изучающих информатику, о котором вы объявили в сентябре?

да. В академических кругах сложно проводить исследования в области разговора, потому что у них нет такой системы, как Alexa, с которой можно было бы работать. Таким образом, мы упрощаем создание новых диалоговых возможностей с помощью модифицированной версии набора навыков Alexa. Эта грандиозная задача - создать социального бота, который сможет вести содержательную, связную и увлекательную беседу в течение 20 минут.

Как вы думаете, это будет разговор на уровне Тьюринга?

Нет, тест Тьюринга сводится к человеческой легковерности - можете ли вы обмануть постороннего, заставив его думать, что это человек? Если задуматься над определенными задачами, Алекса уже лучше человека. Человеку очень сложно воспроизвести конкретную песню из миллионов записей каталога за секунду, верно? Если вы попросите Alexa вычислить факториал 60, это будет сложно для человека. Поэтому мы определенно не хотели, чтобы это было похоже на тест Тьюринга. Это больше о согласованности и вовлеченности.

О чем люди будут говорить в этих 20-минутных разговорах с Alexa?

Мы даем темы. Например: "Можете ли вы поговорить на самые популярные темы в сегодняшней газете?" Мы ожидаем, что социальный бот сможет поговорить с вами на такие темы, как научные изобретения или финансовый кризис.

Много ли вы откликались на этот вызов?

У нас огромное количество заявок, сотни и сотни. Мы предоставляем финансирование студентам университетов - это аспиранты, которые также берут отпуск для своих исследований или, надеюсь, это очень соответствует их исследованиям, поэтому мы хотели убедиться, что у них есть спонсорство для убедительного применения речи. У нас было так много, что мы не могли определиться с первоначальными десятью запланированными, и в итоге мы профинансировали двенадцать команд.

Из-за огромного спроса со стороны корпораций на лучших студентов в области искусственного интеллекта и машинного обучения есть опасения, что академические круги могут потерять свои основные таланты.

Это вызывает беспокойство. Это одна из причин, по которой я был заинтересован в запуске конкурса Alexa Prize. Мы хотим создать новое поколение ученых, занимающихся машинным обучением и искусственным интеллектом, и академические круги играют в этом важную роль. Я думаю, было бы очень близоруко и очень страшно, если бы каждый профессор перешел в такие компании, как мы.

С другой стороны, вы, очевидно, нанимаете талантливых специалистов по искусственному интеллекту, конкурируя с Google, Facebook, Microsoft, Apple и даже традиционными компаниями. Что вы предлагаете потенциальным новобранцам, чтобы они пришли в Amazon?

Не думаю, что мне стоит на это отвечать, потому что другие компании будут копировать это.

На самом деле, если вы ответите хорошо, эти люди могут прочитать это здесь и подать заявку на работу в Amazon.

Уникальность исследований в такой компании, как Amazon, - это сочетание данных, вычислительной мощности и лучших умов мира, объединившихся для решения проблемы, с которой сталкиваются клиенты. Работа над проблемой, с которой сталкиваются клиенты, не отменяет инноваций - они фактически ускоряют инновации. Все проблемы, которые мы пытаемся решить в Amazon, очень сложны. Когда Alexa начинала свою деятельность, решение проблемы распознавания речи и понимания естественного языка во многих различных областях было явно очень и очень сложной проблемой.

Сегодня вы анонсируете новые инструменты, которые помогут разработчикам, не так ли?

да. Одна из ключевых вещей, которые мы хотим упростить для разработчиков, - это то, что мы называем «встроенным намерением» и «типами слотов».

Разъясните, пожалуйста.

В большинстве случаев люди захотят сказать что-то вроде «Алекса, остановись». Или «отменить». Вы хотите, чтобы эти команды или намерения были представлены разработчику, а не пытались сказать разработчикам, чтобы они создавали индивидуальные версии таких вещей, как намерение отменить / остановить. Типы слотов - это такие вещи, как названия городов, словарный запас. Ранее мы сделали несколько из них, которые разработчики используют довольно часто - около 10 намерений и 15 типов слотов. Поэтому в рамках развития навыков сторонних разработчиков мы анонсируем более широкий набор из сотен встроенных функций - типов слотов - в разных доменах, таких как книги, видео или местный бизнес. А также большой набор намерений, которые помогают отвечать на запросы, которые люди задают Alexa.

Другими словами, если я разработчик, я могу положиться на ваш встроенный словарь и ваше толкование синонимов, чтобы с первого взгляда улучшить свои навыки. И вы делаете больше.

Точно. Это дает вам гораздо лучшую отправную точку для взаимодействия с навыками. Мы объявляем об этом как предварительную версию для разработчиков по двум причинам. Во-первых, мы хотим увидеть, как люди используют их в своих намерениях, потому что у нас есть определенное мышление в отношении того, как следует использовать эти намерения и типы. Но у разработчика может быть несколько иное мышление. И клиент может использовать его немного иначе. Мы хотим быть уверены, что получаем отзывы от разработчиков и постоянно улучшаем их, и мы будем продолжать добавлять все больше и больше встроенных модулей.

Прямо сейчас, когда пользователи вызывают навык в Echo, сознание Alexa в некоторой степени переключается на этого разработчика. Итак, то, что вы внедряете сегодня, является шагом к стандартному словарю Alexa и средствам выполнения, которые разработчики будут использовать?

Вы абсолютно правы, это создает общий словарный запас, которым можно поделиться и помочь самой Alexa становиться все лучше и лучше. Разработчики могут интегрировать эту новую функциональность, чтобы им не приходилось воссоздавать одни и те же вещи.

Моя проблема с Alexa в том, что я просто поражен тем, что доступно. Как правило, вы должны знать, что навык существует, чтобы вызвать его. Теперь, когда у вас 5000 навыков и их количество растет, как пользователь может не отставать?

Мы определенно хотим, чтобы Алекса рассказала вам, как выполнить ваш запрос с помощью сторонних навыков, даже если у вас нет знаний об этом навыке. Мы еще этого не сделали, но это определенно входит в нашу дорожную карту. Наличие общего словарного запаса помогает нам установить эту связь.

Amazon - лишь одна из нескольких компаний, использующих ИИ для создания диалогового интерфейса. В чем уникальность вашего подхода?

Возможность громкой связи является ключевым моментом. Это потрясающее приложение для речи. Если вы думаете об Alexa и Echo в частности, не было никаких отговорок с точки зрения решения сложной проблемы взаимодействия без экрана. Таким образом, наше мышление с самого начала сильно отличалось от других компаний с точки зрения того, каким должен быть интерфейс разговора. Это не было похоже на телефон; это было полностью специализированное устройство без экрана. Нам предстояло решить трудную задачу.

А как насчет людей, которых беспокоит наличие в доме открытого микрофона? Что вы можете сказать людям, которые беспокоятся: «Боже мой, Amazon все время меня слушает!»

Конфиденциальность важна, и мы очень, очень прозрачны в том, как мы к этому подходим. Облако вас не слушает. Это только на устройстве, действующем как детектор, а не на распознаватель, распознающий все слова. Он определяет, разговаривает ли Alexa или что-то еще. Как только он определит, что Alexa разговаривал с устройством с очень высокой степенью достоверности, только тогда мы начинаем потоковую передачу в облако.

Станет ли Alexa проактивным, как Google Now или уведомления Apple? Может быть, если услышит, что я стучусь по дому, он скажет мне, что мне нужно уйти, потому что я опаздываю на встречу?

Мы определенно думали об этом. Поскольку в Echo нет экрана, в нем есть несколько новых [проблем]. Мы хотим делать все правильно с любым типом уведомлений, о которых вы говорите. Но прямо сейчас я не могу раскрыть наш точный подход к этому.

Сейчас люди в значительной степени должны выбрать один диалоговый интерфейс для своего помощника. Сможем ли мы когда-нибудь увидеть мэшап, в котором Alexa, Cortana, Google Home, Samsung Viv или что-то еще будут работать вместе?

Это очень первые дни для общения в такой обстановке. Наблюдая это за 20 с лишним лет, я все еще чувствую, что [интеллектуальная собственность] Alexa и Echo является революционным материалом, особенно с точки зрения интерфейса. Я думаю, это еще предстоит выяснить; у каждой компании свой набор предложений, поэтому вы можете себе представить, что будет несколько ИИ. Но с точки зрения взаимодействия еще рано говорить.

Echo и технология Alexa, казалось, стали неожиданностью для многих из нас, и сначала люди думали, что это был быстрый способ покупать товары на Amazon. Теперь это один из самых популярных продуктов Amazon и значимая платформа. Изменилась ли ваша миссия?

Я бы не сказал, что миссия изменилась. Мы все еще очень много делаем то, что, как мы сказали три года назад, мы должны делать. Прямо сейчас нужно многое сделать, чтобы сделать Alexa еще более волшебной для наших клиентов.