Пример использования того, как мы нацеливаем пользователей на разные продукты в зависимости от их покупательной способности с помощью машинного обучения.
Введение
Цель этого анализа состояла в том, чтобы определить различные группы пользователей на основе сделок, которым они помогли, используя дисконтное приложение, чтобы перенаправить их на предложения, аналогичные тем, которым они помогали в прошлом.
Алгоритм машинного обучения K-means использовался для определения пользовательских сегментов на основе их покупательского поведения. Вот трехмерная иллюстрация извлеченного алгоритма.
Терминология:
Прежде чем углубляться в анализ, давайте определим некоторые используемые ключевые слова.
Доступность сделки: когда пользователь пользуется скидкой через приложение.
Израсходовано: цена, которую пользователь платит со скидкой при покупке товара.
Сохранено: Количество, сэкономленное пользователем через приложение.
Бренды: поставщики, для которых предлагаются скидки, например Pizza Hut, GreenO
Сделки: предлагаемые скидки пользователям в разных торговых точках и брендах.
Анализ
Наборы данных
Набор данных о поведении был извлечен из Mixpanel с помощью JQL. Следующее было использовано для этого анализа
userId: уникальный идентификатор пользователя
saveAmount: сумма, сэкономленная пользователем при получении результатов по сделке
loadedAmount: потраченная пользователем сумма при наличии сделки
brandName: бренд, для которого сделка была заключена
count: количество сделок, заключенных пользователем
Используя приведенный выше набор данных, для каждого пользователя были рассчитаны averageSpentAmount, averageSavedAmount и dealAvailCount, как показано ниже.
Машинное обучение - кластеризация по шкале K-средних
Первым шагом алгоритма k-средних было нахождение оптимального количества кластеров для сегментации. Для этой цели существует ряд методов, один из которых - метод локтя, использующий квадрат суммы внутри кластера (wcss).
На основе метода локтя для исследования сегментов использовались 4, 5 и 6 кластеров, и 4 кластера были выбраны как лучшие для данного набора данных.
Я бы порекомендовал эти курсы в Data camp и Coursera, если вы хотите узнать больше о кластеризации и сегментации пользователей.
Какие сегменты извлечены с помощью К-средних?
Ниже приведены средние статистические данные по четырем идентифицированным сегментам:
Пользователи в сегментах 1 и 2 были высокооплачиваемыми пользователями, причем пользователи сегмента 1 также экономили одинаково много на сделку (вероятно, воспользовавшись предложениями «Купи 1, получи 1»). Однако количество сделок, совершенных этими пользователями, было меньше 2 (т. Е. 1,3 и 1,4 соответственно).
С другой стороны, пользователи сегментов 3 и 4 тратили меньше и, следовательно, меньше экономили. Тем не менее, пользователи сегмента 4 имели наибольшее количество сделок на одного пользователя (в среднем более 9 сделок, заключенных каждым пользователем) во всех 4 сегментах. Это была самая конверсионная группа пользователей.
Каково было общее количество пользователей и количество заключенных сделок в каждом сегменте?
Вот общее количество пользователей и сделок, которым воспользовались пользователи каждого сегмента.
57% пользователей относятся к сегменту 3, и только 3% пользователей относятся к сегменту с наибольшей конверсией (то есть сегменту 4).
Сколько в целом тратили пользователи?
Вот разброс расходов по каждому сегменту
Некоторые пользователи из сегмента 4 имели высокие расходы (желтые точки в сегменте 4), аналогичные сегментам 1 и 2, но сегмент 3 (который составляет 57% пользователей) вообще не пошел на сделки с высокими затратами и / или бренды. .
Тип бренда, который предпочитают пользователи каждого сегмента?
Давайте посмотрим, какой бренд используют пользователи этого сегмента, чтобы понять, в чем они различны.
Пользователи сегмента 1 могли сочетать гамбургеры, пиццу и развлечения, пользователи сегмента 2 - пиццу, а пользователи сегмента 3 - гамбургеры. В то время как пользователи сегмента 4 (большинство конверсионных пользователей) отдали предпочтение сокам и другим типам брендов.
Какие бренды использовались в каждом сегменте?
Вот 10 самых популярных брендов, которым воспользовались эти сегментированные пользователи.
Глядя на бренды, мы можем понять, какой тип бренда и предложения предпочтут пользователи этого сегмента. Пользователи сегментов 1 и 2 (высокооплачиваемые пользователи) пользовались услугами премиальных брендов, таких как Sajjad, kababi, Charcoal, California и т. Д., В то время как сегменты 3 и 4 (низкооплачиваемые пользователи) в основном выбирали бренды среднего и низкого уровня.
Как можно использовать эти результаты?
На основе разных сегментов пользователей мы можем:
1. Таргетированная реклама
Персонализация рекламы для каждого сегмента повысит коэффициент конверсии, поскольку пользователи с большей вероятностью совершат конверсию по определенным брендам и предложениям. Так, например, показывайте рекламу Саджада пользователям с более высокой платежеспособностью, чем пользователям с низкой платежеспособностью.
2- Рекомендации в приложении
Оптимизируйте приложение, чтобы рекомендовать предложения и скидки в приложении, которые будут больше интересовать пользователей каждого сегмента.
Резюме
Подводя итог, с помощью данных и надлежащих усилий мы смогли выявить интересную информацию о пользователях и их предпочтениях, а также разработать стратегии, как привлечь пользователей с учетом их предпочтений.