Сегментация клиентов, анализ RFM и расчет ценовой эластичности для исследования рынка

Содержание

Весь код и результаты можно найти на моем GitHub

Контекст и данные

Набор данных состоит из информации о покупках шоколадных батончиков (5 разных марок) 500 человек из заданного района при входе в физический магазин «FMCG» в течение 2 лет. Все данные были собраны с помощью карт лояльности, которые они используют при оформлении заказа. Данные были предварительно обработаны, и нет никаких пропущенных значений. Кроме того, объем набора данных был ограничен и анонимизирован для защиты конфиденциальности клиентов.

Описание каждого столбца и то, что они представляют, присутствует в файле Purchase-Data-Legend.

Цель

Две основные цели проектов

  • Сегментация клиентов
  • Эластичность цены

Сегментация клиентов

Разделение наших клиентов на разные сегменты (группы/сегменты), чтобы

  • Эти группы будут иметь сопоставимое покупательское поведение.
  • Члены одного и того же сегмента одинаково реагируют на различные маркетинговые мероприятия.
  • Члены из разных сегментов по-разному реагируют на разные маркетинговые мероприятия.

Поскольку у нас есть как данные о покупках клиентов, так и демографические данные клиентов, мы будем использовать соответствующую структуру/алгоритмы, наиболее подходящие для каждого из них для выполнения сегментации.

Проведение Анализа по каждому из сегментов для KYC(знай своего клиента).

Этот процесс поможет команде маркетинга лучше понять наших клиентов, что позволит им разработать и реализовать эффективные маркетинговые стратегии, подходящие для каждого из сегментов, чтобы максимизировать вероятность покупки.

Эластичность цены

Ценовая эластичность продукта измеряет изменение вероятности покупки продукта на 1% увеличения его цены.

Это помогает нам определить вероятность покупки продукта или вероятность того, что клиент купит данный продукт по этой цене.

1) Моделирование ценовой эластичности Candy’s в разных ценовых категориях.

2) Как эти ценовые эластичности влияют на наличие/отсутствие рекламной акции

Выполнение вышеуказанных задач поможет нам следующим образом.

  • Поскольку Доход = Продажи * Цена, это поможет нам определить оптимальную цену, при которой у нас будет высокая вероятность покупки, что увеличит наш доход.
  • Помогите нам определить скидку (%), для следующей продажи.
  • Если мы собираемся выпустить новый продукт, это может дать нам представление о том, какой ценовой диапазон будет безопасным.

Поскольку у нас есть 5 различных брендов и их соответствующие данные о покупках, вычисление кросс-ценовой эластичности нашего бренда по отношению к другим, это даст нам следующее понимание

  • Какой бренд можно рассматривать в нашей товарной категории как ближайший конкурент (т. е. какой бренд с большей вероятностью будет альтернативой нашему бренду для клиентов, которые в настоящее время покупают наши продукты)
  • Прогнозируйте, как продажи или доля рынка нашего бренда повлияют на изменения цен наших конкурентов.
  • В случае огромных скидок от наших конкурентов, насколько мы должны снизить наши цены, чтобы вернуть себе долю рынка?

Методология

Сегментация

  • Для сегментации с демографическими данными используется кластеризация K-средних. Поскольку результаты изначально были неудовлетворительными, PCA использовался как средство для извлечения скрытых признаков, и к этим скрытым признакам применялось K-Means, мы получили 4 кластера как оптимальные (проверено методом локтя).
  • Для сегментации на основе данных о транзакциях/покупках используется анализ RFM (Recency Frequency Monetary).

Эластичность цены

  • Логистическая регрессия используется для моделирования взаимосвязи между ценами и вероятностями покупок.
  • Используя модель для дальнейшего моделирования вероятностей покупки для различных ценовых диапазонов. Эти прогнозы вместе с коэффициентами модели используются для расчета ценовой эластичности.
  • Многомерная логистическая регрессия используется для вычисления перекрестной ценовой эластичности.

Результаты

Сегментация

Кластеризация K-средних

Основываясь на демографических данных, таких как их доход, место проживания, возраст и т. д., сегменты помечены как «рабочий класс», «городские жители», «ветераны» и «полезные» (названия сегментов субъективны).

Были обнаружены различные характеристики каждого сегмента, такие как следующие

  • на какой бренд каждый сегмент тратит больше денег
  • какой сегмент чаще посещает магазин
  • какой клиент покупает больше во время акции

Поэтому, когда у нас есть новый клиент, зарегистрированный только на основе его / ее демографических данных, мы можем классифицировать их в один из сегментов, что повысит вероятность того, что целевой маркетинг и персонализированное продвижение сработают.

Несколько других результатов сегментации упомянуты в разделе ценовой эластичности ниже.

RFM-анализ

В зависимости от даты покупки каждого клиента за два года они были классифицированы по следующим сегментам:

  • Клиенты-чемпионы
  • Лояльные клиенты
  • Потенциальный лоялист
  • Недавние клиенты
  • Перспективные клиенты
  • Клиенты, требующие внимания
  • о спать
  • Клиенты из группы риска
  • Не могу их потерять (ценно)
  • Потерял

В отличие от сегментов, сгенерированных с помощью K-средних, это стандартные отраслевые ярлыки. Как обращаться с этими сегментами, чтобы получить наибольшую выгоду, также хорошо задокументировано, эти сегменты также помогут нам определить клиентов, которые, скорее всего, уйдут.

Эластичность цены

Ниже приведены результаты расчета ценовой эластичности.

  • Для данного продукта по цене мы можем предсказать вероятность покупки, если цена изменится на x%.
  • если бы мы увеличили наши цены на 1% при цене 1,25 доллара, то вероятность покупки нашего продукта снизилась бы на 1,04%, эта вероятность увеличилась бы до 3,5%, если бы она увеличилась на 1% при цене 2 доллара.
  • Таким образом, вывод о том, что включение одного и того же 1% в разных ценовых категориях по-разному влияет на наши продажи.

  • Нам удалось выяснить, какой сегмент покупателей наиболее чувствителен к изменению цен, чем другие.
  • Рабочий класс наиболее чувствителен к изменению цен

  • Мы обнаружили, что люди были менее эластичны к повышению цен, когда была распродажа, а это означает, что реклама цены продукта как цены со скидкой сделает клиентов менее чувствительными к повышению цены продукта.

Эта информация может помочь нам в принятии решений, таких как распределение бюджета на маркетинг/рекламу каждого сегмента рекламной акции

Ниже приведены выводы, полученные в результате вычисления перекрестной эластичности цен (рассматривая наш бренд как бренд-2).

На основе данных о продажах мы выяснили, какие бренды являются нашими ближайшими конкурентами (т. е. какой бренд с большей вероятностью предпочтут наши клиенты в качестве альтернативы)

  • Ближайший конкурент нашему бренду – бренд-1.

Мы смогли рассчитать, насколько повлияют продажи нашего бренда (вероятность покупки) в результате изменения цен нашего конкурента.

  • если бы бренд-1 снизил цену своего продукта на 1% (по его средней цене), то это уменьшило бы продажи (вероятность покупки) нашего бренда на 0,2%
  • что, если мы снизим цену нашего продукта на 1% в качестве счетчика скидки на бренд 1, тогда мы увидим рост продаж нашего бренда примерно на 1%.

Мы также подсчитали, насколько мы должны снизить наши цены, чтобы сохранить долю рынка, если наш конкурент предоставит скидки.

  • Было подсчитано, что если бренд-1 увеличит свою цену на 1%, то, чтобы свести на нет снижение наших продаж, мы могли бы просто снизить нашу цену на 0,2%.

Эта информация поможет нам принять стратегические решения о корректировке наших цен, чтобы получить или сохранить долю рынка в результате изменения цен нашими конкурентами

Ограничение

Цена, несомненно, является одной из важных характеристик или переменных, которые клиент принимает во внимание, принимая решение о покупке или нет, но это не единственный фактор, который он / она будет учитывать.

  • Один из основных недостатков расчета ценовой эластичности заключается в том, что мы пытаемся смоделировать вероятность покупки клиентов, используя только цену продукта, а это означает, что мы предполагаем, что цена продукта является единственным фактором, влияющим на решение клиента о покупке. продукт, который, как мы знаем, не имеет места в реальном мире.
  • Другие факторы, такие как личный вкус покупателя, обладает ли бренд продукта характеристиками, к которым естественно тяготеет покупатель, потребности клиентов и т. д., также играют важную роль, сказав, что для некоторых продуктов, которые можно назвать «товарами», цена будет более или менее единственный фактор, который клиент будет учитывать.
  • Таким образом, анализ ценовой эластичности будет более точным для продуктов, которые являются товарами, а шоколад не является товаром. Для продуктов, отличных от товаров, нам потребуются другие характеристики, которые могут учитывать такие элементы, как психология клиентов, вкусы, требования и т. д.