Взгляните на рекомендации IBM Watson Assistant Intent

И как он может выявить пробелы в обучающих данных и исправить их

Введение

…а также, как это сделать с помощью ИИ для улучшения диалогового ИИ

Чаще всего первым шагом в создании чат-бота является перечисление различных намерений. На самом деле намерения — это разные намерения, которые пользователь может захотеть реализовать при использовании вашего чат-бота.

Из этого примера образец навыка обслуживания клиентов видно, что разные намерения явно связаны друг с другом.

Первым намерением, к которому обращаются, обычно является приветствие, затем прощание, за которым следует светская беседа.

Ключ в том, чтобы точно сегментировать намерения и не иметь конфликтов. И не иметь слишком много или слишком мало намерений.

Если намерений слишком много, неизбежны конфликты, с дублированием данных. Если их слишком мало, чат-бот неизменно не удовлетворит запрос и потребность пользователя. Вы начнете видеть сценарии, такие как резервное распространение.

Это вызов, когда намерения детализированы, но не слишком детализированы. А также верно обратное.

Намерение Рекомендация

Реальный сценарий слишком часто представляет собой группу людей, которые сидят вместе и решают, что и как может сказать пользователь.

Слишком часто это действительно приближение, которое потребует болезненных итераций для увеличения перекрытия. Идеальным вариантом является наличие существующих разговоров с клиентами, которые можно проанализировать, чтобы обнаружить и сгруппировать намерения пользователей.

Примером этого может быть список фраз, где пользователи спрашивают о времени полета. Действительно, это может быть одно намерение, #Ask_Flight_Times. Но что, если бы мы могли взять список примеров запросов и заставить машину сгруппировать их по типам сущностей?

Ниже приведена выдержка из электронной таблицы путешественников, которые спрашивают о времени полета.

Этот список фраз был добавлен в качестве источника данных в навык IBM Watson Assistant. В дополнение к этому, рекомендуемые намерения и примеры намерений можно получить из подключенных живых помощников и файлов CSV.

Уотсон определил девять различных намерений из исходных данных, которые сосредоточены вокруг различных способов, которыми пользователи могут сформулировать вопрос. Из автоматически сгенерированных рекомендаций видно, как результаты должны быть представлены пользователю.

Например:

  • Расписание,
  • или список,
  • или время для конкретного рейса.
  • Также авиакомпания и день связаны.

Источник данных

Для этого примера нашим источником данных является ATIS Airline Travel Information System. Существуют различные группы данных, но мы рассмотрим только группу atis_flight_time. Это составляет пятьдесят пять записей.

Тестовая среда

Тестовая среда — IBM Watson Assistant Plus. После загрузки данных Watson оценивает высказывания пользователей и выявляет общие проблемные области, о которых часто упоминают клиенты.

Затем Watson Assistant отображает набор дискретных групп связанных примеров пользователей-кандидатов, отражающих текущие потребности клиентов. Группы настолько детализированы по объему, что вы можете добавить отдельно сгруппированные примеры пользователей-кандидатов для одного и того же намерения.

Вы можете просмотреть каждое рекомендуемое намерение и соответствующие пользовательские примеры, чтобы выбрать те, которые вы хотите добавить к своим обучающим данным.

Загрузка исходных данных

В главной консоли Watson Assistant выберите вкладку Источники рекомендаций. Это приведет вас к области, где вы управляете своими исходными данными.

Опять же, исходные данные могут быть из текущих живых разговоров. Отсюда лог от ассистента, который развернут и активно взаимодействует с клиентами.

Альтернативой является загрузка файла CSV или нескольких файлов. Процесс загрузки, очевидно, зависит от размера набора данных.

Список высказываний можно извлечь из расшифровок чатов центра поддержки или других связанных, записанных разговоров с клиентами в организации.

Вам нужно будет определиться с типом источника рекомендаций; вы не можете иметь оба.

Добавляемые исходные данные рекомендаций используются для получения как намерений, так и примеров рекомендаций.

Это важная функция, поскольку данные группируются в намерения. И внутри каждого из этих определенных намерений Watson Assistant составляет список, который представляет собой пользовательские примеры.

Имя созданных намерений может быть загадочным. Лучше переименовать его во что-то более понятное для дальнейшего использования. Очевидно, вы можете использовать эти сгенерированные значения в качестве руководства, а также редактировать и обновлять их по своему усмотрению.

Просто взглянув на то, как Watson Assistant упорядочивает данные, вы уже получите множество идей и идей по организации данных.

Примеры намерений

Примеры, перечисленные под каждым намерением, позволяют раскрыть это конкретное намерение и повысить точность вашей модели при назначении высказывания пользователя. Целевое число составляет от 10 до 20 примеров высказываний для каждого намерения.

При проверке намерения, даже такого простого, как #Cancel, где пользователь может отменить любую текущую активность… И при поиске пользовательских рекомендаций по примерам результатов не было.

Это точный результат, так как ни один из загруженных справочных данных не связан с намерением #cancel.

Опять же, цель состоит в том, чтобы точно увеличить охват намерения и, следовательно, обогатить модель.

Когда мы выбираем намерение, связанное с доступными обучающими данными, мы получаем результаты.

На изображении ниже вы можете увидеть рекомендуемые фразы, которые можно выбрать и добавить к намерению.

Что мне нравится в этом подходе, так это то, что он измеряется и полностью контролируется пользователем. Данные можно загружать в большом количестве, но проверка и добавление рекомендаций выполняется вручную, что позволяет последовательно и контролируемо улучшать навыки.

Из примеров также видно расположение и возможные значения сущностей. Сущности могут быть выбраны в примере намерения и определены.

В приведенном здесь примере два слова «san» и «francisco» могут быть определены как одна сущность и присвоены типу сущности city. Возможно, даже может быть назначен конкретный объект, связанный с контекстом города отправления или города прибытия.

Из сгенерированных данных можно почерпнуть идеи о том, что может представлять собой объект. Но по мере роста популярности и использования контекстных сущностей контекст также может быть понят и реализован.

Вывод

Процесс создания диалогового пользовательского интерфейса необходимо планировать и выполнять очень тщательно.

Неправильное начало расстроит пользователей и приведет к длительному процессу улучшения чат-бота.

Данные важны, используемая структура также важна, и возможность масштабирования по требованию имеет решающее значение.

Подробнее здесь…