15 общих тенденций и наблюдений в области разговорного ИИ

Сбор информации от лидеров Gartner и IDC

Введение

Можно утверждать, что традиционно чат-боты или диалоговые агенты искусственного интеллекта состоят из четырех столпов архитектуры.

Эта архитектура очень универсальна для коммерческих платформ чат-ботов; существование:

  • Намерения (НЛУ)
  • Сущности (НЛУ)
  • Ответы бота (он же скрипт/диалог бота)
  • Управление конечным автоматом (диалог)

Как видно здесь, есть два основных компонента;

  • Компонент NLU и
  • Компонент управления диалогами.

В случае с Microsoft, Rasa, Amazon Lex, Oracle и т. д. различие и разделение между ними четко и ярко выражено. В случае с IBM Watson Assistant это не так.

Компонент NLU состоит из:

  • Намерения (глагол) и
  • Сущности (существительные).

Компонент «Диалог»:

  • ответы ботов и
  • Машина развития и управления состоянием диалога.

Двумя препятствиями на пути превращения чат-ботов в настоящих агентов ИИ являются намеренияи машины состояний.

  • В чат-боте первая линия облегчения разговора — это распознавание намерений.
  • И в этом заключается проблема: на большинстве платформ чат-ботов существует своего рода модель машинного обучения, используемая для присвоения пользователю высказывания определенного намерения.
  • И отсюда намерение привязывается к определенной точке конечного автомата (также известному как дерево диалогов). Как видно из приведенной ниже последовательности, пользователь вводит «Я думаю о покупке собаки». соответствует намерению Купить собаку. И отсюда намерения жестко привязаны к точкам входа в диалог.

Этот тесный слой между моделью NLU ML и диалогом является непреложным в том смысле, что он является условным сценарием если-это-то-то, который управляет диалогом.

Список намерений также является фиксированной и жестко заданной ссылкой внутри чат-бота. Любой мыслимый пользовательский ввод необходимо предвидеть и сопоставлять с единым намерением.

Опять же, список намерений жесткий и фиксированный. Впоследствии каждое намерение связывается с частью предопределенного диалога; как упоминалось ранее.

Движение на рынке заключается не в обесценивании одного или нескольких из этих столпов, а в стирании границ между ними. Мы наблюдаем своего рода слияние, особенно с диалоговыми интерфейсами или интерфейсами управления сценариями. Компоненты управления состоянием диалогов добавляются в NLU и многое другое.

Общие тенденции и наблюдения в области разговорного ИИ

Среди ведущих полноценных платформ разговорного ИИ формируются несколько общих тенденций и наблюдений…

1️⃣ В намерения встраивается структура в виде иерархических, или вложенных намерений (HumanFirst & Cognigy). Намерения можно включать и выключать, добавлять веса. Пороги устанавливаются для каждого намерения релевантности, в некоторых случаях порог может быть установлен для подсказки устранения неоднозначности. Подшаблоны внутри намерений (см. Kore.ai). У Kore.ai также есть дополнительные намерения и последующие намерения.

2️⃣ Конкретные намерения связаны с определенными разделами потока, а намерения и сущности тесно связаны; тем самым создавая прочную связь между намерениями и конкретными объектами.

3️⃣ Интенты можно перетаскивать, сбрасывать, вкладывать, не вкладывать (HumanFirst).

4️⃣ Распространение дизайнерского подхода к управлению диалогами. Управление диалогами поддерживает (в целом) отступление, устранение неоднозначности, мультимодальность с возможностями графического дизайна. Особое внимание уделяется интеграции и включению голосовых ботов. В настоящее время существует четыре различных подхода к управлению состоянием диалога и его развитию.

5️⃣ Также реализуется идея сохранения контекста между намерениями и разделами разных потоков диалогов. Особенно сделать путешествие часто задаваемых вопросов актуальным и доступным для разных путешествий и намерений.

6️⃣ Подход SaaS с возможностью установки локального частного облака.

7️⃣ Сущности могут быть аннотированы в намерениях, могут быть определены составные сущности. И структура вводится в сущности. В случае LUIS вложенные сущности машинного обучения. Или структура в смысле регулярных выражений, списков, отношений и т. д. Kore.ai реализовал идею пользовательских шаблонов для сущностей.

8️⃣ Улучшено управление диалоговыми подсказками скрипта или чат-бота, это очень полезно в случае многоязычных диалоговых агентов.

Nuance Mix имеет удобный пользовательский интерфейс для управления сообщениями в диалоговом потоке. Вмешательство может быть установлено на уровне сообщения. Это очень похоже на IVR и Voicebots. Текст можно определить для текстового интерфейса или голосового помощника. Голосовые помощники требуют очень специфических дизайнерских решений. Из-за эфемерной природы голоса нет никаких возможностей для визуального дизайна. Поэтому сообщения нужно сокращать.

9️⃣ Простота использования с нетехническим сквозным подходом к решению.

🔟 Дизайн и разработка сливаются, что, вероятно, способствует упадку такого инструмента дизайна, как BotSociety.

1️⃣1️⃣ Основное внимание уделяется сокращению времени обучения, при этом предлагается решение в виде поэтапного обучения (быстрая сборка Cognigy, поэтапное обучение Rasa) или ускорения времени обучения в целом (IBM Watson Assistant)

1️⃣2️⃣ Обнаружение нерелевантности получает особое внимание от IBM Watson Assistant. Также является элементом верстака HumanFirst.

1️⃣3️⃣ Негативные паттерны. Их можно выявить и устранить. Например, пользователь говорит: «Я пытался забронировать рейс, но столкнулся с проблемой». Хотя машина идентифицирует намерение как Забронировать рейс, это не так. пользователь хочет сделать. В таком случае определение попытки как отрицательного шаблона гарантирует, что совпадающее намерение будет проигнорировано. В Kore.ai это стандартная реализация.

1️⃣4️⃣ Идея Черты широко распространена в Kore.ai. Черты — это определенные объекты, атрибуты или детали, которые пользователи выражают в своих разговорах. Высказывание может напрямую не передавать какое-либо конкретное намерение, но черты, присутствующие в высказывании, используются для определения намерений и потоков диалога с ботом.

1️⃣5️⃣ Используя модель универсального языка Cognigy, можно создавать намерения и примеры предложений на английском языке, а затем говорить с агентом на немецком, японском или русском, и он все равно сопоставит ввод с правильным намерением.

Несколько языков являются обычным явлением. Общий, общий язык также доступен на некоторых платформах, таких как Cognigy и Watson Assistant. HumanFirst определяет языки на лету очень интуитивно.

В IBM Watson Assistant доступен универсальный язык. Универсальная модель, которая адаптируется к любому другому языку, который вы хотите поддерживать.

Заключение

Как видно по этим 15 пунктам, функциональность растет, а четыре столпа трансформируются в ряд вертикальных векторов и конкретной функциональности.