Автор: Шива Саи Н, старший вице-президент по продуктам искусственного интеллекта

По мере того, как интеллектуальные диалоговые интерфейсы (чат-боты) становятся все более популярными, ожидания от этой среды выросли до почти человеческой способности отвечать на запросы, совершать транзакции и решать проблемы для предприятия.

Ответы на фактоиды сегодня остаются большой проблемой в диалоговых интерфейсах. Современные специалисты используют простые системы ответов на вопросы, которые обучаются бизнес-пользователям с помощью тщательно подобранных вопросов и ответов. В Active.AI мы заново изобрели системы ответов на вопросы с помощью отмеченного наградами модуля «Когнитивные вопросы и ответы», который использует комбинацию глубокого обучения и обучения с подкреплением для достижения способности перефразировать, определять фокус запроса и находить наилучший из возможных ответов, даже если вариант не был предоставлен. корпоративными пользователями.

Однако ограничение состоит в том, что фактоид должен существовать в обучающих данных (тщательно подобранный набор пар вопрос-ответ), подготовленных корпоративными пользователями. Учитывая спектр продуктов и услуг, которые предлагают крупные предприятия, такие как банки, огромное количество вопросов, которые необходимо задать, чтобы обеспечить полный охват. Это также представляет собой проблему обслуживания, поскольку продукты, условия и правила постоянно меняются, и их необходимо распространять на еще один канал, который намного сложнее, чем простой веб-сайт, управляемый CMS.

Понимание прочитанного - это задача ИИ, которая требует, чтобы система вопросов и ответов обрабатывала фрагмент текста, понимала и могла извлекать фрагмент текста, который является ответом на запрос пользователя.

S tanford Qu estion A nswering D ataset (SQuAD) - одна из таких публичных проблем, расширяющих пределы прогнозирования диапазона Тип Вопросно-ответного механизма. (Https://rajpurkar.github.io/SQuAD-explorer/).

Тест SQuAD 1.1 на понимание машинного чтения (MRC), создание системы, которая могла бы читать документ и отвечать так же хорошо, как и человек. SQuAD 2.0 должен был «способствовать развитию систем понимания прочитанного, которые знают то, чего они не знают».

Мы инвестировали в эту область в течение последних 2 кварталов, и наш новый подход к решению проблемы понимания прочитанного основан на многозадачном изучении двух задач естественного языка:

1. ARSG: создание ожидаемой структуры ответа, т. Е. Прогнозирование различных структур ответа на запрос, даже не зная ответа.

Например, для запроса «сколько вам лет» система может сгенерировать несколько ожидаемых структур ответа, например, «мой возраст …….», «мне …… лет»

2. Прогнозирование объема текста / документа, содержащего ответ.

Система обучена изучать обе задачи вместе, обмениваясь важной информацией по задачам для лучшего ответа на вопросы.

Мы отправили часть основного решения в SQuAD и попали в таблицу лидеров Стэнфордского теста на понимание машинного понимания. Active.Ai в настоящее время представлен выше Microsoft Research Asia, Microsoft Business Applications AI Research, IBM Research AI и Института искусственного интеллекта Аллена. Мы также входим в десятку лучших в мире по набору данных SQuAD 1.1 и в двадцатку лучших по всему миру по набору данных SQuAD 2.0 с наивысшими оценками 74,746 (точное совпадение) и 78,227 (f1) в SQuAD 1.1, что очень близко к показателям Human performance, указанным в этом набор данных в 81.30 (EM) и 88.9 (F1). Это была наша первая работа, и мы очень довольны результатами. Мы стремимся улучшить эти показатели в следующие 2 квартала.

Хотя рейтинг SQuAD - это одно, нас больше интересует реальное развертывание этой технологии. SQuAD является относительно более простой задачей, чем проблема реального мира, потому что нам нужно обрабатывать намного больше контента для любого практического приложения в диалоговых интерфейсах, что делает очень важной возможность выбирать абзацы-кандидаты из более чем 10 000 абзацев. Наряду со способностью понимать структурированный встроенный контент, такой как таблицы, также важны.

Системы понимания прочитанного общего назначения по-прежнему носят экстрактивный характер. Например, он может ответить только в том случае, если ответ присутствует непосредственно в контенте, на котором он был обучен. Возможность выводить факты из нескольких частей контента и формулировать ответ на запросы пользователей значительно сложнее.

Мы прогнозируем, что наше первое развертывание функции понимания прочитанного произойдет в 2019 году и, скорее всего, будет сосредоточено на внутреннем приложении, которое поможет предприятию принимать более обоснованные решения и предоставлять более качественные услуги.

Чтобы узнать, над какими интересными нововведениями работает команда, посетите Active.Ai.