Это статья автора Built In, размещенная здесь

Нынешнее поколение виртуальных помощников по-прежнему борется за надежность. Следующий будет использовать достижения в области машинного обучения и обработки естественного языка, чтобы предложить пользователям до смешного беспроблемный опыт.

Такие помощники, как Siri, Google Now и Amazon Alexa, существуют менее десяти лет, и они уже стали невероятно распространенными. Людям нравится идея умного помощника, который может сделать все, что попросишь. Но если вы когда-либо пытались проверить возможности любого из этих помощников, вы очень быстро понимаете, что они просто еще не совсем там. Как сказал Дж. Р. Рафаэль в ComputerWorld:

Правда в том, что голосовые помощники, несмотря на весь их прогресс и множество способов использования, по-прежнему слишком часто выходят из строя, чтобы быть надежными. И чем больше Google и другие компании продвигают своих виртуальных помощников и расширяют сферы своей деятельности, тем более актуальной становится проблема решения этой проблемы.

Что ждет этих помощников в будущем? Это больше навыков? Больше возможностей? Я считаю, что, хотя эти основные устройства будут постепенно улучшаться, они будут делать это гораздо медленнее, чем нам хотелось бы. Поскольку эти помощники управляются исключительно обработкой естественного языка и машинным обучением, неудача является естественным результатом отсутствия более сложных навыков, которые еще предстоит развить. Стоимость найма операторов-людей для обеспечения выполнения запросов была бы неприемлемой — даже для таких технологических гигантов, как Apple.

В январе 2019 года Amazon объявила о продаже более 100 миллионов устройств Alexa. Внедрение этих устройств, подкрепленное масштабными маркетинговыми кампаниями, приведет к широкому внедрению и нормализации в обществе технологий голосового помощника. Но как они улучшатся?

ГИБРИДНОЕ БУДУЩЕЕ

За последние несколько лет появилось несколько компаний, работающих в сфере помощников/консьержей. Такие компании, как Velocity Black, нацелены на создание высококлассных консьерж-сервисов, ориентированных на сверхбогатых, в то время как другие, такие как нынешняя компания GoButler, пытались создать бесплатный консьерж-сервис для широких масс.

Эти новые компании сосредоточены на создании решений, которые создают реальную ценность для пользователей, выходящих за рамки простой доставки информации. Они не только помогают вам с вашим календарем, но и организуют для вас вещи в реальном мире. Что объединяет большинство этих компаний, так это то, что все они почти полностью приводятся в действие людьми, сидящими за компьютером и выполняющими запросы клиентов. Это означает, что они, в конечном счете, ограничены человеческим трудом и ограниченными возможностями, которые постоянно ограничивают их способность к масштабированию, ограничивая их полезность для масс пользователей. В результате закон спроса и предложения диктует, что их услуги должны стать более дорогими и менее доступными, как мы видели с Магией, еще одним личным помощником, когда пользователи пытались зарегистрироваться в массовом порядке.

Будущее наполнено мечтами о помощнике, полностью управляемом искусственным интеллектом. Однако, за исключением открытия искусственного общего интеллекта, ближайшее будущее, скорее всего, будет гибридным: хотя люди по-прежнему будут частью уравнения, они, вероятно, будут дополнять передовые, постоянно обучающиеся системы ИИ, которые постепенно берут на себя все больше и больше рабочие места. Это поможет увеличить пропускную способность и снизить стоимость этих услуг для пользователей. Со временем мы достигнем точки, когда сочетание систем искусственного интеллекта и стратегического партнерства с существующими приложениями будет обеспечивать выполнение подавляющего большинства запросов клиентов. Мы не знаем, как будет выглядеть будущее решений, основанных исключительно на искусственном интеллекте, но недавние достижения в области машинного обучения дают нам подсказки о функциях, которые могут быть востребованы.

ЧТО БУДУТ СДЕЛАТЬ АССИСТЕНТЫ СЛЕДУЮЩЕГО ПОКОЛЕНИЯ

1. ПОНИМАЙТЕ ЭМОЦИИ

Такие компании, как Affectiva, создали технологии, использующие последние достижения в области граничных вычислений, которые позволяют им обучать и запускать сложные модели глубокого обучения на локальных аппаратных устройствах пользователей. Эти разработки позволят виртуальным помощникам эффективно анализировать голос очень экономичным способом, а затем генерировать список эмоциональных характеристик, связанных с коротким аудиофрагментом. Короче говоря, помощники могут использовать подобные технологии, чтобы понять, что мы чувствуем, когда разговариваем с ними и предлагаем помощь, или адаптировать ответы, чтобы быть сочувствующими.

2. ПОНЯТЬ КТО ТЫ

Инструмент IBM Watson Personality Insights использует последние достижения в области обработки естественного языка и моделей психологических черт для анализа простой речи пользователя и сгенерированного пользователем текста. Программа создает полную картину личности пользователя, связанных с ним тенденций и даже факторов, побуждающих к покупке. Ассистентские службы могут использовать подобные технологии, чтобы лучше понимать нас, и использовать эту информацию для изменения того, как они с нами разговаривают.

3. ПОНИМАЙТЕ, ЧТО ВЫ ХОТИТЕ

Я и моя команда в Wing создаем технологии, которые позволяют пользователям просить нас что-то сделать, рассказывать нам о своих предпочтениях и автоматизировать то, что они хотят, на лету. В нашей работе используются новые методы, которые используют генеративно-состязательные нейронные сети (GAN), систему, в которой несколько конкурирующих нейронных сетей принимают огромные объемы данных и конкурируют друг с другом, чтобы генерировать наиболее похожие на человека действия против собранных обучающих данных. Короче говоря, система может научиться делать что-то в реальном мире в ответ на человеческую речь. Например, вы говорите Доброе утро, и ваш помощник заказывает вам ваш любимый завтрак, чтобы добраться до работы, проводит утренний брифинг и сообщает, что ваш Uber для работы скоро будет снаружи.

4. СДЕЛАТЬ ВСЕ ДЛЯ ВАС

Большинство этих современных помощников выходят далеко за рамки простого вопроса и ответа. Фактически, они работают с сотнями компаний-партнеров через API, чтобы делать что-то от вашего имени.

Это всего лишь несколько примеров того, что помощники нового поколения смогут делать, используя машинное обучение и обработку естественного языка. В конечном счете, возможности этих систем машинного обучения зависят от их использования; чем больше данных они получают от большой группы пользователей, тем быстрее они могут совершенствоваться.

ЧТО О КОНФИДЕНЦИАЛЬНОСТИ?

Некоторые из вещей, которые эти новые помощники смогут делать, коренным образом изменят наши отношения с нашими устройствами, вызовут серьезные разговоры о конфиденциальности и заставят людей более тщательно обдумывать, чем они должны делиться с этими помощниками. Сможем ли мы по-прежнему верить, что компании, стоящие за этими вспомогательными услугами, заботятся о наших интересах? Крупные корпорации, предлагающие свои услуги помощников бесплатно или по невероятно низкой цене, по своей сути имеют что-то, чтобы выиграть; например, когда помощники покупают товары и услуги исключительно у своих материнских компаний. Надеюсь, мы будем стремиться к компаниям, которые создают для своих пользователей услуги, ориентированные на конфиденциальность.

Я считаю, что будущее помощников следующего поколения — за гибридными системами, управляемыми людьми иИИ. Они будут делать что-то для вас в реальном мире (и с вашего согласия), использовать ваши данные, чтобы узнавать о вас, принимать обоснованные решения и вести себя как настоящий помощник. Достижения в области обработки естественного языка, машинного обучения, а также скорость и доступность обучающих сложных систем глубокого обучения — вот что заставляет этих помощников становиться умнее с каждой минутой. Настоящий Джарвис для всех уже не за горами.