15 общих тенденций и наблюдений в области разговорного ИИ
Сбор информации от лидеров Gartner и IDC
Введение
Можно утверждать, что традиционно чат-боты или диалоговые агенты искусственного интеллекта состоят из четырех столпов архитектуры.
Эта архитектура очень универсальна для коммерческих платформ чат-ботов; существование:
- Намерения (НЛУ)
- Сущности (НЛУ)
- Ответы бота (он же скрипт/диалог бота)
- Управление конечным автоматом (диалог)
Как видно здесь, есть два основных компонента;
- Компонент NLU и
- Компонент управления диалогами.
В случае с Microsoft, Rasa, Amazon Lex, Oracle и т. д. различие и разделение между ними четко и ярко выражено. В случае с IBM Watson Assistant это не так.
Компонент NLU состоит из:
- Намерения (глагол) и
- Сущности (существительные).
Компонент «Диалог»:
- ответы ботов и
- Машина развития и управления состоянием диалога.
Двумя препятствиями на пути превращения чат-ботов в настоящих агентов ИИ являются намеренияи машины состояний.
- В чат-боте первая линия облегчения разговора — это распознавание намерений.
- И в этом заключается проблема: на большинстве платформ чат-ботов существует своего рода модель машинного обучения, используемая для присвоения пользователю высказывания определенного намерения.
- И отсюда намерение привязывается к определенной точке конечного автомата (также известному как дерево диалогов). Как видно из приведенной ниже последовательности, пользователь вводит «Я думаю о покупке собаки». соответствует намерению Купить собаку. И отсюда намерения жестко привязаны к точкам входа в диалог.
Этот тесный слой между моделью NLU ML и диалогом является непреложным в том смысле, что он является условным сценарием если-это-то-то, который управляет диалогом.
Список намерений также является фиксированной и жестко заданной ссылкой внутри чат-бота. Любой мыслимый пользовательский ввод необходимо предвидеть и сопоставлять с единым намерением.
Опять же, список намерений жесткий и фиксированный. Впоследствии каждое намерение связывается с частью предопределенного диалога; как упоминалось ранее.
Движение на рынке заключается не в обесценивании одного или нескольких из этих столпов, а в стирании границ между ними. Мы наблюдаем своего рода слияние, особенно с диалоговыми интерфейсами или интерфейсами управления сценариями. Компоненты управления состоянием диалогов добавляются в NLU и многое другое.
Общие тенденции и наблюдения в области разговорного ИИ
Среди ведущих полноценных платформ разговорного ИИ формируются несколько общих тенденций и наблюдений…
1️⃣ В намерения встраивается структура в виде иерархических, или вложенных намерений (HumanFirst & Cognigy). Намерения можно включать и выключать, добавлять веса. Пороги устанавливаются для каждого намерения релевантности, в некоторых случаях порог может быть установлен для подсказки устранения неоднозначности. Подшаблоны внутри намерений (см. Kore.ai). У Kore.ai также есть дополнительные намерения и последующие намерения.
2️⃣ Конкретные намерения связаны с определенными разделами потока, а намерения и сущности тесно связаны; тем самым создавая прочную связь между намерениями и конкретными объектами.
3️⃣ Интенты можно перетаскивать, сбрасывать, вкладывать, не вкладывать (HumanFirst).
4️⃣ Распространение дизайнерского подхода к управлению диалогами. Управление диалогами поддерживает (в целом) отступление, устранение неоднозначности, мультимодальность с возможностями графического дизайна. Особое внимание уделяется интеграции и включению голосовых ботов. В настоящее время существует четыре различных подхода к управлению состоянием диалога и его развитию.
5️⃣ Также реализуется идея сохранения контекста между намерениями и разделами разных потоков диалогов. Особенно сделать путешествие часто задаваемых вопросов актуальным и доступным для разных путешествий и намерений.
6️⃣ Подход SaaS с возможностью установки локального частного облака.
7️⃣ Сущности могут быть аннотированы в намерениях, могут быть определены составные сущности. И структура вводится в сущности. В случае LUIS вложенные сущности машинного обучения. Или структура в смысле регулярных выражений, списков, отношений и т. д. Kore.ai реализовал идею пользовательских шаблонов для сущностей.
8️⃣ Улучшено управление диалоговыми подсказками скрипта или чат-бота, это очень полезно в случае многоязычных диалоговых агентов.
Nuance Mix имеет удобный пользовательский интерфейс для управления сообщениями в диалоговом потоке. Вмешательство может быть установлено на уровне сообщения. Это очень похоже на IVR и Voicebots. Текст можно определить для текстового интерфейса или голосового помощника. Голосовые помощники требуют очень специфических дизайнерских решений. Из-за эфемерной природы голоса нет никаких возможностей для визуального дизайна. Поэтому сообщения нужно сокращать.
9️⃣ Простота использования с нетехническим сквозным подходом к решению.
🔟 Дизайн и разработка сливаются, что, вероятно, способствует упадку такого инструмента дизайна, как BotSociety.
1️⃣1️⃣ Основное внимание уделяется сокращению времени обучения, при этом предлагается решение в виде поэтапного обучения (быстрая сборка Cognigy, поэтапное обучение Rasa) или ускорения времени обучения в целом (IBM Watson Assistant)
1️⃣2️⃣ Обнаружение нерелевантности получает особое внимание от IBM Watson Assistant. Также является элементом верстака HumanFirst.
1️⃣3️⃣ Негативные паттерны. Их можно выявить и устранить. Например, пользователь говорит: «Я пытался забронировать рейс, но столкнулся с проблемой». Хотя машина идентифицирует намерение как Забронировать рейс, это не так. пользователь хочет сделать. В таком случае определение попытки как отрицательного шаблона гарантирует, что совпадающее намерение будет проигнорировано. В Kore.ai это стандартная реализация.
1️⃣4️⃣ Идея Черты широко распространена в Kore.ai. Черты — это определенные объекты, атрибуты или детали, которые пользователи выражают в своих разговорах. Высказывание может напрямую не передавать какое-либо конкретное намерение, но черты, присутствующие в высказывании, используются для определения намерений и потоков диалога с ботом.
1️⃣5️⃣ Используя модель универсального языка Cognigy, можно создавать намерения и примеры предложений на английском языке, а затем говорить с агентом на немецком, японском или русском, и он все равно сопоставит ввод с правильным намерением.
Несколько языков являются обычным явлением. Общий, общий язык также доступен на некоторых платформах, таких как Cognigy и Watson Assistant. HumanFirst определяет языки на лету очень интуитивно.
В IBM Watson Assistant доступен универсальный язык. Универсальная модель, которая адаптируется к любому другому языку, который вы хотите поддерживать.
Заключение
Как видно по этим 15 пунктам, функциональность растет, а четыре столпа трансформируются в ряд вертикальных векторов и конкретной функциональности.