Alexa Conversations - это новый подход к диалоговым интерфейсам, основанный на искусственном интеллекте

Но делает ли это разговор более естественным?

Введение

Если посмотреть на доступные в настоящее время инструменты и среды разработки чат-ботов, можно выделить три недуга, которые требуют лечения:

  • Составные контекстные объекты
  • Разложение сущности
  • Прекращение поддержки машины с жесткими состояниями, управление диалогами

Цель Alexa Conversations - преобразовать голосовое взаимодействие от однократного до многооборотного. Более сложные разговоры, такие как бронирование авиабилета, заказ еды или банковское дело, требуют многооборотных разговоров.

Можно сказать, что диалоговая коммерция требует среды для быстрой и эффективной разработки многооборотных разговоров. Amazon, должно быть, осознал это, и Alexa Conversations - их попытка удовлетворить эту потребность.

Составные контекстные сущности

В этой области были достигнуты огромные успехи, и многие экосистемы чат-ботов учитывают их.

Контекстные сущности

Процесс аннотирования пользовательских высказываний - это способ идентификации сущностей по их контексту в предложении.

Часто сущности имеют конечный набор определенных значений. Затем есть объекты, которые не могут быть представлены конечным списком; например, города мира или названия или адреса. У этих типов сущностей слишком много вариантов, чтобы их можно было перечислить по отдельности.

Для этих сущностей вы должны использовать аннотации; сущности, определяемые их контекстным использованием. Сущности определяются и обнаруживаются через их контекст в высказывании пользователя.

Составные сущности

Основная предпосылка заключается в том, что пользователи будут произносить несколько сущностей в одном предложении.

Пользователи, скорее всего, будут выражать несколько сущностей в одном высказывании; называются составными объектами.

В приведенном ниже примере определены четыре объекта:

  • travel_mode
  • from_city
  • to_cyt
  • date_time

Эти объекты могут быть обнаружены во время первого прохода и подтверждения от пользователя.

Разложение сущности

Подход Microsoft LUIS

Декомпозиция сущности важна как для прогнозирования намерений, так и для извлечения данных с помощью сущности. Лучше всего объяснить это на примере.

Начнем с определения единой сущности, которая называется

  • Подробная информация о путешествии.

Внутри этой сущности мы определили три суб-сущности. Вы можете думать об этом как о вложенных объектах или подтипах. Определены три подтипа:

  • Период времени
  • Режим
  • Город

Отсюда у нас есть подтип для City:

  • Из города
  • В город

Лидером по декомпозиции сущностей является Microsoft LUIS, подробнее о нем можно прочитать здесь. Я бы сказал, что у LUIS есть полное решение в этом отношении.

Разговоры Amazon Alexa

Беседы имеют аналогичный вариант, хотя и не такой полный и исчерпывающий, как LUIS. В разговорах вы можете определять сущности, которые Amazon называет слотами.

Цель во время разговоров - заполнить эти ячейки (сущности). В разговорах вы можете создать слот, к которому привязано несколько свойств. Эти свойства можно рассматривать как под-слоты или подкатегории, которые вместе составляют сущность более высокого порядка.

Alexa Conversations представляет новый тип слота настраиваемый со свойствами (PCS).

Составление набора слотов, которые являются иерархическими. Это можно использовать для передачи структурированных данных между компонентами времени сборки, такими как определения API и шаблоны ответов.

Прекращение поддержки диалогового управления машиной с жесткими состояниями

Отказ от использования конечного автомата для управления диалогами требует более абстрактного подхода; Многие не хотят отдавать контроль модели ИИ.

Цель Alexa Conversations (AC) - предоставить разработчикам инструменты для создания более естественного ощущения навыка Alexa с меньшим количеством строк кода. AC - это управляемый искусственным интеллектом подход к управлению диалогами, который позволяет создавать навыки, с которыми пользователи могут взаимодействовать естественным образом, без каких-либо ограничений. Этот управляемый ИИ

подход более абстрактный, но больше разговоров, основанных на процессе разработки. Образцы диалогов важны вместе с аннотацией данных.

Вы предоставляете Alexa набор диалогов для демонстрации функций, необходимых для выполнения навыка.

Системы времени сборки, лежащие в основе Alexa Conversations, будут использовать диалоговые окна и создавать тысячи вариантов этих примеров. Этот процесс сборки занимает довольно много времени.

К счастью, любые ошибки обнаруживаются в самом начале процесса, что удобно.

AC создает статистическую модель, которая интерпретирует вводимые пользователем данные и предсказывает наилучший отклик модели.

На основе этой информации AC сможет сделать точные предположения.

AC использует искусственный интеллект, чтобы преодолеть разрыв между голосовым приложением, которое вы можете создать вручную, и широким спектром возможных разговоров.

Компоненты каркаса

Пять компонентов времени сборки:

  • Диалоги
  • Слоты
  • Наборы высказываний
  • Шаблоны ответов
  • Определения API

Диалоги

Диалоги на самом деле являются примером разговоров между пользователем и Alexa, которые вы определяете. Вы можете видеть, что разговор многооборотный, а его сложность - на ваше усмотрение.

Для прототипа есть три объекта или слота, которые мы хотим захватить, и четырех примеров диалогов с четырьмя высказываниями в каждом было достаточно. Опять же, эти разговоры или диалоги будут использоваться AC для создания модели ИИ для создания естественной и адаптивной модели диалога.

Слоты

Слоты - это на самом деле объекты, которые вы хотели бы заполнить во время разговора. Если пользователь произнесет все три требуемых слота в первом высказывании, в разговоре будет только один диалог.

Разумеется, беседа может быть более продолжительной, если потребуется больше поворотов беседы, чтобы запросить относительную информацию от пользователя для заполнения слотов. Интересная часть - это два типа слотов или сущностей. Пользовательские слоты со значениями и слоты со свойствами.

Alexa Conversations представляет настраиваемые типы слотов со свойствами (PCS) для определения данных, передаваемых между компонентами. Они могут быть единственными или составными. Как указывалось ранее, составные объекты или слоты можно разложить.

Составные сущности, которые можно разложить, будут расти в реализации, и вы начнете видеть, как они используются в большем количестве фреймворков.

Наборы высказываний

Наборы высказываний - это группы высказываний, которые пользователи могут произносить в Alexa, которые могут включать в себя слоты. Они используются при аннотировании поворотов, вводимых пользователем в диалоге.

Это один большой недостаток, который я вижу в AC, поскольку для каждой перестановки слотов / объектов необходимо определить примеры.

Например:

1. abc
2. a
3. b
4. c
5. ab
6. bc
7. ac

Для трех слотов / объектов необходимо предоставить семь наборов примеров. Представьте, как это расширится, если у вас будет больше слотов / объектов.

Шаблоны ответов

Ответы - это то, как Alexa реагирует на пользователей в виде аудио- и визуальных элементов. Они используются при добавлении комментариев к ответам Alexa в диалоге.

Определения API

Определения API определяют интерфейсы с вашей серверной службой, используя аргументы в качестве входных данных и возвращаемые в качестве выходных данных.

Вывод

AC - это определенно движение в правильном направлении ...

Добро

  • Появление составных слотов / объектов, которые можно разложить. Добавление структур данных в сущности.
  • Прекращение поддержки конечного автомата и создание модели ИИ для управления диалогом.
  • Делаем голосовых помощников более разговорчивым.
  • Сущности / слоты с контекстными аннотациями.
  • Сообщения об ошибках во время построения модели были описательными и полезными.

Не очень хорошо

  • Это может показаться незначительным; но построение модели требует времени. Я обнаружил, что ошибки в моей модели обнаружились в начале процесса построения модели, и обучение остановилось. Если в вашей модели нет ошибок, то сборка длинная.
  • Определение наборов высказываний громоздко. Создание наборов высказываний для всех возможных перестановок, если у вас большое количество слотов / сущностей, не идеально.
  • Это сложно, особенно по сравнению с такой средой, как Раса. Искусство состоит в том, чтобы улучшить разговорный опыт, вводя сложные модели искусственного интеллекта; одновременно упрощая среду разработки.

Подробнее здесь