В экосистемах B2B сервисные билеты усеяны аббревиатурами, названиями продуктов и другим жаргоном, который может относиться к разным контекстам. Давайте рассмотрим эти две повседневные жалобы, получаемые двумя разными командами компании с акронимом ‘acc’ и словом ‘block’:

«Мой аккаунт заблокирован, и я не могу сбросить пароль».

«Утеряна моя карта, мой аккаунт заблокирован»

Устранение разницы между двумя "acc" в этом примере - дорогостоящий процесс, поскольку проблема сводится к проблеме относительности. Формализация этой точки зрения на практике требует высокой вычислительной сложности. В условиях предприятия устранение такой разницы точно приводит к реальной ценности, но лексика деловых взаимодействий представляет собой лишь небольшую часть объема данных, содержащихся в карманном словаре. Следовательно, огромное количество наборов данных для изучения языка, для которых моделируются традиционные алгоритмы языковой обработки, либо не в состоянии уловить правильные отношения между словами, либо становятся дорогостоящими в вычислительном отношении для таких сценариев, где правильные ответы требуются на тактовой частоте . Это делает их непригодными для рентабельных трансформационных изменений в экосистемах B2B.

Языка вашего бизнеса нет в учебниках, и большей части его нет в словаре. Фактически, деловой язык часто может существовать исключительно внутри команд, продуктовых портфелей и географических регионов, что исключает возможность стандартизации. Вот почему традиционные алгоритмы, смоделированные на основе лингвистических теорий, которые пытаются уловить семантические тонкости человеческого языка, не подходят для отображения грамматически случайных разговоров из канала помощи и поддержки на значимые метки, которые фактически отражают информацию, содержащуюся в контексте текста заявки.

Способность делать тонкие языковые различия, как в нашем примере, также называется выразительностью. При использовании традиционных моделей обучения выразительность и эффективность как функций поиска, так и обучения находятся в противоречии, что делает их развертывание дорогостоящим из-за их ресурсоемкости и большой допустимой погрешности.

Представьте себе возможность, которая учится на ваших данных и использует алгоритмы, которые могут обнаруживать цель запросов, сопоставляя текст с векторами в многомерном нелинейном пространстве - и все это изнутри вашего корпоративного межсетевого экрана с минимальной вычислительной мощностью. Назовем это извлечением намерения. Такая возможность может дать предприятиям доступ к человеческому языку, позволяя мгновенно превращать жалобы клиентов с беспорядочными полутонами в точные ярлыки и ссылки на знания. После этого команды по работе с клиентами смогут понять это и действовать в соответствии с этим, не тратя сотни кликов на неправильные документы и «экспертные беседы». Если бы такой алгоритм мог учиться на корпоративных данных, а не на заранее определенном очищенном наборе языковых данных, он не пропустил бы ваш жаргон, ваши сокращения и даже неправильно составленные смешанные языковые фразы!