За чатом: как работает робот-помощник для электронной коммерции AliMe

Как узнать, кто ваш продавец - человек или робот?

Самые значительные инновации в области искусственного интеллекта за последние годы - умные чат-боты и личные помощники - это лишь малая часть того, что ждет нас в будущем. Технологические компании, такие как Google, Facebook, Microsoft, Amazon и Apple, находятся в авангарде персонализированных интерактивных продуктов, в которых технология интеллектуального взаимодействия человека с компьютером (IHCI) будет по-прежнему играть центральную роль в автоматизированном обмене сообщениями, помощи при выполнении задач и Интернете вещей. По мере развития рынка чат-боты становятся все более и более специализированными в соответствии со своими специализированными целями, такими как обслуживание клиентов, развлечения, личная помощь или образование.

Запущенное в июле 2015 года приложение AliMe - это руководство по покупкам и помощник для электронной коммерции на основе IHCI, которое меняет традиционные сервисы и улучшает взаимодействие с пользователем в Интернете. Во время фестиваля покупок Double 11 в 2017 году компания AliMe успешно ответила на 9,04 миллиона запросов, и на ее долю пришлось 95% клиентских услуг, предоставляемых платформами электронной коммерции Alibaba.

Системы интеллектуального взаимодействия человека с компьютером (IHCI) обычно называют чат-ботами или бот-системами. Понимание естественного языка (NLU) является самой основой IHCI, диалоговой системы, которая обрабатывает вопросы пользователей и генерирует ответы на естественном языке. Это само по себе является подвигом, поскольку компьютеры построены на логически тяжелых когнитивных основах, которые не подходят для обработки динамических человеческих языков.

Первый шаг в создании AliMe требовал настройки абстрактных фреймворков для различных полей, слоев и сценариев.

Стратифицированная структура AliMe

Большинство используемых сегодня интеллектуальных процессов сопоставления делятся на три основные категории: сопоставление на основе правил, поиск и DL. Технология, лежащая в основе AliMe, основана на сочетании всех трех.

Таким образом, диалоговая система делится на следующие слои:

1. Уровень выявления намерений

Этот слой определяет основное намерение каждого сообщения, классифицируя их, а затем извлекая их атрибуты. Поскольку намерения определяют последующий поток идентификации домена, уровень намерений является необходимым первым шагом в инициировании процессов контекстной модели данных и модели данных предметной области.

2. Отвечающий слой:

Вопросы сопоставляются и идентифицируются для получения ответов; В диалоговой системе AliMe используются три стратегии ответа в соответствии с разными намерениями:

a. Часто задаваемые вопросы, такие как «Что мне делать, если я забыл свой пароль?» инициировать запрос к графу знаний или модели поиска.

Граф знаний строится путем интеллектуального анализа сущностей и фраз, отношения которых предопределены, из обширного пула доступных данных. Хотя методы, основанные на графах знаний, точно определяют ответы, они также приводят к более высоким затратам на обслуживание и более свободным исходным структурам данных. Дизайн вопросов и ответов AliMe преодолевает это за счет интеграции традиционных моделей поиска.

б. Такие задачи, как «Я хочу заказать на завтра рейс из Нью-Йорка в Париж в одну сторону», могут быть решены с помощью модели «обязательство намерения + сопоставление слотов» или модели глубокого обучения с подкреплением (DRL).

c. Болтовня, например «Я в плохом настроении», предлагает метод, сочетающий модель поиска с глубоким обучением (DL).

Домен болтовни в основном включает два типа моделей - модель, основанную на поиске и глубинную генеративную модель. Первый делает выбор из фиксированного корпуса ответов, относящихся к данному запросу, а второй является более продвинутым, генерируя ответы, не полагаясь на какой-либо корпус. Интегрированные достоинства двух моделей составляют основу чат-машины AliMe. Во-первых, наборы данных-кандидатов вызываются с использованием традиционной модели поиска; затем наборы кандидатов повторно ранжируются с помощью модели Seq2Seq; кандидат с наивысшим ответом выбирается, когда рейтинг ранжирования выше, чем предварительно установленный порог, в противном случае активируется модель seq2seq для генерации ответа.

Практики глубокого обучения идентификации намерений AliME

Выявление и извлечение намерений AliME зависит от результатов классификации. AliME включает в себя функции как традиционного текстового, так и пользовательского поведения для анализа неполных намерений пользователя.

В процессе создания систем прогнозирования на основе DL команда предложила два конкретных варианта моделирования. Модель множественной классификации, хотя и более быстрая, требовала переобучения с каждой новой меткой, добавляемой к семейству классов, тогда как модель бинарной классификации, явно отстающая от постоянной дихотомизации, позволяла неограниченное расширение полей на исходной платформе. Было очевидно, что обе модели с их конкретными недостатками и сильными сторонами обслуживают очень разные наборы сценариев.

Классификация намерений AliME на основе DL включает поведенческие факторы и текстовые особенности и объединяет различные векторы перед обработкой множественной или двоичной классификации. Текстовые функции могут быть представлены в виде набора слов или встраивания слов.

Как AliMe работает как интеллектуальный гид по покупкам

Интеллектуальные системы управления покупками взаимодействуют с пользователями, чтобы анализировать их намерения, чтобы сделать покупки более удобными. Взаимодействия служат двум основным целям: помощь машинам в понимании намерений пользователей и оптимизация рейтинга рекомендаций и самого интерактивного процесса.

Созданы интеллектуальные системы советов по покупкам, чтобы определить, чего хотят пользователи и какие атрибуты этих товаров. Это приносит с собой новый набор проблем:

Проблема 1. Пользователи обычно выражаются короткими предложениями, поэтому для точного определения намерений требуется несколько раундов.

Проблема 2. Пользователи часто взаимодействуют непоследовательно, детализируя или изменяя части своих намерений.

Проблема 3. Намерение покупателей не всегда может быть семантически правильным или точным.

Проблема 4. Отношения между намерениями очень сложны.

AliME может включать фразовые выражения, переключатели границ намерений и логические модификации благодаря стеку намерений и графу знаний о продукте. Из-за огромного разнообразия товаров графы знаний объединены с семантическими индексами, чтобы сделать идентификацию чрезвычайно эффективной.

В сценариях интеллектуального руководства по покупкам управление категориями состоит из идентификации категорий и расчета отношений категорий.

Идентификация категории

Планы идентификации AliME построены на графах знаний, семантических индексах и DSSM (модели глубокого семантического сходства). Семантические индексы построены на текстовой информации, а также на данных поиска и кликов. Сходства между сегментацией слов и категориями кандидатов вычисляются с использованием встраивания слов.

Расчет отношений категорий

Расчет отношений категорий учитывает намерения, вытекающие из интеллектуального руководства по покупкам. Двумя важными примерами этих отношений являются отношения гипонимии и отношения подобия.

Например, когда пользователь сначала намеревается купить одежду, но позже передумает купить чашку, атрибуты, связанные с одеждой, не должны передаваться в чашку. С другой стороны, если пользователь передумает и покупает рубашку, гипоним одежды, атрибуты, связанные с одеждой, должны быть переданы рубашке.

Гипонимические отношения можно рассчитать двумя способами:

а) Расчет отношений на основе графа знаний

б) Извлечение из запросов пользователей

Отношения подобия можно вычислить с помощью следующих двух вариантов:

а) Использование одного и того же гиперонима. Например, Xiaomi и Huawei используют фразу «мобильный телефон» как гипероним.

б) семантическое сходство на основе вычислений встраивания

Путь впереди для технологий IHCI

Хотя технологический прогресс, наблюдаемый в 21 веке, значителен, нынешняя фаза ИИ и его применения определенно только зарождаются. Сферы, от восприятия до познания, требуют значительных улучшений для того, чтобы IHCI продолжала поддерживать промышленность. Усилия по сбору данных и уточнению графов знаний будут способствовать развитию IHCI. Боты, ориентированные на выполнение конкретных задач, в различных отраслях промышленности готовы обеспечить взрывной экономический рост; Однако интерактивные боты, нацеленные на открытые домены, потребуют более тщательной проверки и экспериментов в долгосрочной перспективе. После успешного внедрения в компьютерное зрение и распознавание голоса DL продолжит применяться в области обработки естественного языка (NLP).

К счастью, безотлагательность разработки ИИ была встречена с одинаковым энтузиазмом со стороны различных заинтересованных сторон, от частных предприятий до правительств и от академических кругов до промышленных сообществ. Учитывая это, мы можем ожидать, что IHCI оправдает наши ожидания и видения в ближайшем и долгосрочном будущем, когда даже самые смелые научно-фантастические фильмы и книги блекнут по сравнению с актуальным уровнем технологий.

(Оригинальная статья Чжоу Вэй, Чен Хайцин)

Alibaba Tech

Подробная и исчерпывающая информация из первых рук о новейших технологиях Alibaba. Подпишитесь на нас: www.facebook.com/AlibabaTechnology

Ссылки:

[1]: Хуанг П.С., Хе Х, Гао Дж. И др. Изучение глубоко структурированных семантических моделей для веб-поиска с использованием данных по щелчку [C] // Международная конференция ACM по конференции по управлению информацией и знаниями. ACM, 2013: 2333–2338.

[2] Минхуэй Цю и Фэн-Линь Ли. MeChat: Движок чат-бота на основе последовательности и повторного ранжирования. ACL 2017

[3] Дмитрий Богданау, Кёнхён Чо и Йошуа Бенжио. 2015. Нейронный машинный перевод путем совместного обучения выравниванию и переводу. В трудах ICLR 2015

[4] Мэтью Хендерсон. 2015. Машинное обучение для отслеживания состояния диалога: обзор. В материалах Первого международного семинара по машинному обучению в обработке разговорной речи.

[5] Мних В., Бадиа А. П., Мирза М. и др. Асинхронные методы обучения с глубоким подкреплением [J]. 2016 г.

[6] Ли Дж., Монро В., Риттер А. и др. Глубокое обучение с подкреплением для создания диалога [J]. 2016 г.

[7] Сордони А., Бенжио Й., Не Дж. Й. Встраивание концепций обучения для расширения запросов с помощью квантовой минимизации энтропии [C] // Двадцать восьмая конференция AAAI по искусственному интеллекту. AAAI Press, 2014: 1586–1592.