Как такие компании, как Spotify, могут использовать анализ настроений и машинное обучение для улучшения взаимодействия с пользователем?

Введение

В одном из моих последних проектов в рамках программы «Наука о данных» школы Flatiron я хотел использовать возможности обработки естественного языка (NLP), чтобы создать классификационную модель, предсказывающую отношение пользователей к отзывам о приложениях Spotify в Google Play Store. Моя цель состояла в том, чтобы лучше понять словарный запас, используемый пользователями в качестве способа извлечения рекомендаций, которые Spotify будет учитывать в рамках постоянных усилий по созданию наилучшего пользовательского опыта прослушивания.

Важность понимания настроений пользователей

Для любой компании или организации, предоставляющей услуги, важно иметь возможность понять свою клиентскую базу. Знание того, как пользователи относятся к вашему продукту или приложению, может дать ценную информацию, которую можно использовать для улучшения их опыта и поддержки стоящих инвестиций. Но как сделать это систематически и объективно? Анализ настроений.

Анализ настроений дает компаниям и заинтересованным сторонам более конкретное понимание отзывов их пользователей. С помощью анализа настроений компании могут улучшить свои отношения с потребителями, отслеживая мнение пользователей о соответствующих функциях данного продукта/приложения; получение подлинных отзывов от пользователей для создания лучших функций и сокращения оттока клиентов; оценка потенциальных тенденций и шумихи на основе того, о чем говорят ваши пользователи.

Бизнес-проблема

Spotify — один из ведущих поставщиков услуг цифровой потоковой передачи музыки. С подкастами, альбомами, песнями и даже персонализированными плейлистами, созданными на основе истории прослушивания пользователей, Spotify насчитывает более 515 миллионов активных пользователей по всему миру по состоянию на 2023 год. Spotify предоставляет пользователям как бесплатные, так и премиальные варианты прослушивания: не менее 317 миллионов пользователей бесплатной версии Spotify и 210 миллионов премиум-подписчиков по всему миру. Spotify имеет одну из самых разнообразных музыкальных библиотек, которая предоставляет пользователям возможность слушать песни из разных стран и культур.

Данные

Данные были собраны из Kaggle, где в период с января по июль 2022 года были извлечены обзоры из магазина Google Play. Исходный набор данных содержал такие функции, как:

  • Отзывы Пользователей
  • рейтинги пользователей (1–5)
  • общее количество лайков (количество пользователей, которые согласились с конкретным отзывом)
  • ответ (ответ службы поддержки клиентов Spotify)

Разработка функций для настроений пользователей

Чтобы извлечь общее настроение для обзора пользователей, я использовал Анализатор интенсивности настроений VADER. VADER — это инструмент на основе правил, который лучше всего подходит для извлечения настроений, используемых в социальных сетях. С помощью VADER я рассчитал общую оценку для каждого отзыва и сопоставил метки настроений на основе следующего:

  • composite_score › 0 ⇒ отзыв в целом положительный
  • composite_score == 0 ⇒ отзыв в целом нейтральный
  • composite_score ‹ 0 ⇒ отзыв в целом отрицательный

Я решил исключить нейтральные отзывы из окончательного набора данных, чтобы создать проблему бинарной классификации, и у меня было около 58 000 отзывов, с которыми нужно было работать.

Метод

Чтобы оценить и выбрать лучшую модель классификации настроений пользователей на основе их отзывов, я применил итеративный подход к каждому протестированному алгоритму машинного обучения. Я начал с использования DummyClassifier из библиотеки sci-kit-learn в качестве основы. Я приступил к оценке каждой модели и алгоритма, используя Precision-Recall AUC. Я использовал PR-AUC, так как набор данных после классификации имел умеренный дисбаланс классов (›60% всех отзывов были классифицированы как положительные), и я хотел сосредоточиться — на основе моей модели — на том, как создать более позитивный опыт (т. е. отзыв имеет общее положительное настроение).

Результаты

Моей последней моделью была базовая логистическая регрессия с параметрами по умолчанию с использованием TFIDFVectorizer с параметрами по умолчанию. На основе этой модели я решил построить облако слов, используя словарный запас, который моя модель считала важным, как сочетания существительных. Поскольку отдельные слова могут не нести интерпретируемую форму семантической информации, я обнаружил, что использование сочетаний с существительными обеспечивает более надежную интерпретацию важности признаков.

Ключевые действия

Основываясь на результатах моей модели и EDA, я построил и использовал облака слов, содержащие словосочетания, извлеченные как из положительных, так и из отрицательных отзывов, а также словарный запас окончательной модели. Я определил три ключевых действия, которые Spotify должен рассмотреть, чтобы лучше классифицировать настроения пользователей и обеспечить наилучшее качество прослушивания для своей пользовательской базы:

Добавлены UX-функции

Постоянной темой из темы, моделирующей положительный пользовательский опыт, была настройка, присущая приложению. Пользователи сообщили, что возможность настраивать и добавлять в персонализированные библиотеки и списки воспроизведения является большим плюсом при рассмотрении приложения. Очевидно, что добавление новых функций, сосредоточенных вокруг обновлений UX/UI, которые предоставляют больше возможностей для настройки, может обеспечить более положительный опыт для пользователей.

Улучшение алгоритма

Похвалы и критики была оценка пользователями музыкальной библиотеки Spotify. Там, где алгоритм предоставлял рекомендации по желаемым песням, пользователи хвалили алгоритм за то, что он дал им более богатый музыкальный опыт. Однако там, где пользователи остались недовольны предоставленными рекомендациями, алгоритм стал предметом разногласий. UX-ориентированный подход к проверке различных музыкальных рекомендаций, данных пользователям, поможет смягчить противоречивое отношение к приложению и алгоритму в целом.

Устранение ошибок

Там, где модель оценивала отзывы как негативные или позитивные, повторяющейся темой были «ошибки» и трудности с функциональностью приложения, особенно с операционными системами Android. Наличие более упорядоченного подхода к устранению ошибок, а также использование ответов службы поддержки клиентов Spotify может помочь в улучшении отношений с потребителями и отзывах.

Сведения о проекте

Вы можете узнать больше о проекте, обратившись к репозиторию Github.

Благодарность и кредиты

Мы выражаем благодарность M Faarisul Ilmi за сбор данных из Google Play Store, которые используются в этом проекте. Посмотрите его профиль на Kaggle здесь

Статистика о Spotify была собрана с сайта The Social Shepherd и доступна здесь.