Пример использования того, как мы нацеливаем пользователей на разные продукты в зависимости от их покупательной способности с помощью машинного обучения.

Введение

Цель этого анализа состояла в том, чтобы определить различные группы пользователей на основе сделок, которым они помогли, используя дисконтное приложение, чтобы перенаправить их на предложения, аналогичные тем, которым они помогали в прошлом.

Алгоритм машинного обучения K-means использовался для определения пользовательских сегментов на основе их покупательского поведения. Вот трехмерная иллюстрация извлеченного алгоритма.

Терминология:

Прежде чем углубляться в анализ, давайте определим некоторые используемые ключевые слова.

Доступность сделки: когда пользователь пользуется скидкой через приложение.
Израсходовано: цена, которую пользователь платит со скидкой при покупке товара.
Сохранено: Количество, сэкономленное пользователем через приложение.
Бренды: поставщики, для которых предлагаются скидки, например Pizza Hut, GreenO
Сделки: предлагаемые скидки пользователям в разных торговых точках и брендах.

Анализ

Наборы данных

Набор данных о поведении был извлечен из Mixpanel с помощью JQL. Следующее было использовано для этого анализа

userId: уникальный идентификатор пользователя
saveAmount: сумма, сэкономленная пользователем при получении результатов по сделке
loadedAmount: потраченная пользователем сумма при наличии сделки
brandName: бренд, для которого сделка была заключена
count: количество сделок, заключенных пользователем

Используя приведенный выше набор данных, для каждого пользователя были рассчитаны averageSpentAmount, averageSavedAmount и dealAvailCount, как показано ниже.

Машинное обучение - кластеризация по шкале K-средних
Первым шагом алгоритма k-средних было нахождение оптимального количества кластеров для сегментации. Для этой цели существует ряд методов, один из которых - метод локтя, использующий квадрат суммы внутри кластера (wcss).

На основе метода локтя для исследования сегментов использовались 4, 5 и 6 кластеров, и 4 кластера были выбраны как лучшие для данного набора данных.

Я бы порекомендовал эти курсы в Data camp и Coursera, если вы хотите узнать больше о кластеризации и сегментации пользователей.

Какие сегменты извлечены с помощью К-средних?

Ниже приведены средние статистические данные по четырем идентифицированным сегментам:

Пользователи в сегментах 1 и 2 были высокооплачиваемыми пользователями, причем пользователи сегмента 1 также экономили одинаково много на сделку (вероятно, воспользовавшись предложениями «Купи 1, получи 1»). Однако количество сделок, совершенных этими пользователями, было меньше 2 (т. Е. 1,3 и 1,4 соответственно).

С другой стороны, пользователи сегментов 3 и 4 тратили меньше и, следовательно, меньше экономили. Тем не менее, пользователи сегмента 4 имели наибольшее количество сделок на одного пользователя (в среднем более 9 сделок, заключенных каждым пользователем) во всех 4 сегментах. Это была самая конверсионная группа пользователей.

Каково было общее количество пользователей и количество заключенных сделок в каждом сегменте?

Вот общее количество пользователей и сделок, которым воспользовались пользователи каждого сегмента.

57% пользователей относятся к сегменту 3, и только 3% пользователей относятся к сегменту с наибольшей конверсией (то есть сегменту 4).

Сколько в целом тратили пользователи?

Вот разброс расходов по каждому сегменту

Некоторые пользователи из сегмента 4 имели высокие расходы (желтые точки в сегменте 4), аналогичные сегментам 1 и 2, но сегмент 3 (который составляет 57% пользователей) вообще не пошел на сделки с высокими затратами и / или бренды. .

Тип бренда, который предпочитают пользователи каждого сегмента?

Давайте посмотрим, какой бренд используют пользователи этого сегмента, чтобы понять, в чем они различны.

Пользователи сегмента 1 могли сочетать гамбургеры, пиццу и развлечения, пользователи сегмента 2 - пиццу, а пользователи сегмента 3 - гамбургеры. В то время как пользователи сегмента 4 (большинство конверсионных пользователей) отдали предпочтение сокам и другим типам брендов.

Какие бренды использовались в каждом сегменте?

Вот 10 самых популярных брендов, которым воспользовались эти сегментированные пользователи.

Глядя на бренды, мы можем понять, какой тип бренда и предложения предпочтут пользователи этого сегмента. Пользователи сегментов 1 и 2 (высокооплачиваемые пользователи) пользовались услугами премиальных брендов, таких как Sajjad, kababi, Charcoal, California и т. Д., В то время как сегменты 3 и 4 (низкооплачиваемые пользователи) в основном выбирали бренды среднего и низкого уровня.

Как можно использовать эти результаты?

На основе разных сегментов пользователей мы можем:

1. Таргетированная реклама
Персонализация рекламы для каждого сегмента повысит коэффициент конверсии, поскольку пользователи с большей вероятностью совершат конверсию по определенным брендам и предложениям. Так, например, показывайте рекламу Саджада пользователям с более высокой платежеспособностью, чем пользователям с низкой платежеспособностью.

2- Рекомендации в приложении
Оптимизируйте приложение, чтобы рекомендовать предложения и скидки в приложении, которые будут больше интересовать пользователей каждого сегмента.

Резюме

Подводя итог, с помощью данных и надлежащих усилий мы смогли выявить интересную информацию о пользователях и их предпочтениях, а также разработать стратегии, как привлечь пользователей с учетом их предпочтений.