Понимание клиентов их собственными словами

«Тогда я сделал то, что умел. Теперь, когда я знаю лучше, мне стало лучше ».
- Майя Анджелоу

Представьте себе, что вы смотрите на список из 45 000 онлайн-отзывов клиентов ... Вы начинаете читать несколько случайных и понимаете, что трудно определить закономерность, хотя вы можете почувствовать определенные темы после прочтения нескольких сотен:

  • «Нам нужно было остановиться и забрать немного масла для моей машины. Здесь было именно то, что нам нужно… »
  • «Отличное расположение рядом с трассой. Межгосударственный въезд находится в нескольких милях от отеля ».
  • «Ужасное обслуживание клиентов. Меня действительно прислал сюда от конкурента. Человек за прилавком не сообщил мне время суток ».

Как вы суммируете избыточный поток неструктурированных данных о клиентах? Ваши клиенты что-то вам говорят, но как вы это прислушиваетесь? Как извлечь смысл из большого количества текста?

Обычно вы можете попробовать визуализацию, например, облако слов, но, за исключением красочного изображения очевидных слов («авто», «запчасти», «обслуживание» и т. Д.), Облака слов не дают ничего полезного. Агрегации (например, количество отзывов с 1-2 звездами по местоположению) имеют определенную ценность, но они также часто бесполезны и бесполезны. На самом деле нам нужны корреляции, значения и концептуальные отношения.

Мы хотим открывать смыслы, скрытые в потоке цифрового контента.

Необходимость извлекать смысл из больших объемов текстового контента, особенно из общения с клиентами, привела к умной технике, названной векторами слов (также известными как встраивание слов). Он существует уже много лет, но мало известен за пределами мира специалистов по интеллектуальному анализу текста и обработке естественного языка (НЛП). Об этом методе стоит знать, потому что, если бы вы знали, что нужно проводить анализ с использованием векторов слов, вы можете быть удивлены тому, что вы можете обнаружить из всего этого текстового контента, циркулирующего по вашему бизнесу.

Все в восторге от машинного обучения. Он обещает превратить данные в золото - без необходимости нанимать дополнительных программистов. Мы надеемся, что программа научится бизнес-правилам на основе данных. Принцип соотнесения входных данных с выходными, прогнозирования будущих значений на основе прошлых значений известен как «регрессия». Вы, наверное, сделали это в Excel. Это интуитивно понятно: проведите линию через набор точек. Нейронные сети выполняют аналогичную функцию. Но подобные методы моделирования работают только с числовыми данными.

Как вы находите корреляции в тексте? Это проблема, которую помогают решить словесные векторы. Векторы слов преобразуют слова в числовые представления, и их можно использовать во множестве случаев. Например, в тысячах обзоров, упомянутых ранее, вот несколько словесных ассоциаций, которые этот метод выявил автоматически:

install => replace, put, change, wipers, offered
employees => workers, people, staff, friendly
employee => guy, associate, person, cashier

Подобные ассоциации с использованием векторов слов позволяют нам делать обобщения на основе текстового содержимого. Но наиболее глубокое использование векторов слов - это их способность находить «аналогии».

Аналогии - это глубокий и фундаментальный аспект того, как мы, люди, думаем и рассуждаем. Прошлый опыт превращается в «извлеченные уроки», и эти уроки по аналогии применяются к новым ситуациям. Например, в детстве вы, возможно, ходили на бейсбольный матч с семьей и с волнением наблюдали, как игрок в мяч буквально «выбил его из парка». Сегодня, если кто-то использует метафору «мы вышли из парка с результатами этого квартала», вы легко поймете значение, даже если это слово является образным: на самом деле никто не играет в бейсбол. Выражение имеет значение, потому что ваш мозг связывает прошлый опыт (даже в другой области) с текущей ситуацией.

Наиболее частое использование векторных слов - это поиск аналогий из текстового контента

Словесные векторы находят подобную аналогию встроенной в текстовое содержимое. Например, я почерпнул эти аналогии из тех же данных отзывов клиентов:

Question: “install” is to “batteries” as _____ is to “bulbs”?
Answer: “install batteries” (is like) “replace bulbs”

Question: “store” is to “location” as _____ is to “service”?
Answer: “store location” (is like) “great service”

Такие связи могут быть очевидны для человека, но удивительно (на мой взгляд), что часть «глухой, немой и слепой» программы, запускающей алгоритм, может обнаружить эти абстрактные закономерности и значения слов. Вот фрагмент кода, показывающий, как простые математические операции (сложение и вычитание) используются для выявления аналогии:

vec1 <- word_vecs[“install”] — word_vecs[“battery”] + word_vecs[“bulb”]
findSimilarVectors(vec1)
> replace     burned      blown
> 0.5984408 0.5895740 0.5864915

В 2013 году Google бесплатно раздал векторно-словный алгоритм под названием Word2Vec. Это было еще одно из бесчисленных маленьких, малоизвестных изобретений, которые вплетены в ткань цифровых технологий в нашей повседневной жизни. С тех пор эта техника совершенствовалась и использовалась во многих отношениях. Я использовал вариант под названием Text2Vec, пакет, доступный в R-коде.

Вы уже пользуетесь услугами, использующими векторы слов, не осознавая этого, но теперь, когда вы знаете, что это такое, и цените его потенциал, вы можете придумать способы использования этого метода интеллектуального анализа текста в своем бизнесе. чтобы лучше понимать, что говорят вам клиенты!

Вот несколько поводов для размышлений:

  • Есть ли у вас база данных отзывов клиентов, например, из колл-центра, где вы нашли конкретную «больную тему» ​​с помощью анализа настроений? Теперь вы хотите знать, есть ли в данных другие деликатные темы, но поскольку вы не знаете буквально, что ищете, вы не можете искать это? Векторы слов можно использовать для поиска в данных обратной связи с клиентами других слов, которые имеют аналогичное отношение к терминам, связанным с удовлетворенностью клиентов.
  • Вы собираетесь запустить новый продукт, но получили некоторые предположения, что название продукта не находит отклика. Какие слова были бы более привлекательными для вашей клиентской базы? Словесные векторы могут содержать термины, похожие на «работу, которую выполняет ваш продукт» для вашего клиента, что упрощает установление отношений и вызывает более естественную реакцию потенциальных покупателей.

Конечно, было время, когда вы не знали, как пользоваться электронными таблицами, но теперь вы не можете представить себе ведение бизнеса без такого инструмента. Таков искусственный интеллект. Это просто инструмент, и он все еще новый, поэтому мы пока не знаем, как им пользоваться. Но со временем методы искусственного интеллекта, такие как интеллектуальный анализ текста, и специальные методы, такие как векторы слов, станут интуитивно понятными и незаменимыми инструментами для решения бизнес-задач.