Демистификация когортного анализа, шаг за шагом

Введение

Давайте признаем это; когортный анализ может показаться пугающим на первый взгляд. Тем не менее, это мощный инструмент, который может дать ценную информацию, а иногда и единственный правильный способ визуализации данных. Их освоение даст вам явное преимущество в вашем путешествии по аналитике данных.

Но сначала, что мы подразумеваем под когортным анализом?

Когортный анализ — это способ изучения и сравнения различных групп людей во времени.

Эти группы определяются общей характеристикой, например датой подключения к службе или первой покупки.

Когортный анализ часто используется для анализа того, насколько клиенты прекращают свои отношения с продуктом или услугой, понятие, обычно называемое «оттоком». Для компаний, использующих подписку, отток представляет собой процент клиентов, отменивших свои подписки в течение заданного периода.

Отток — это важный бизнес-показатель, который может значительно повлиять на доход и рост. В то время как высокий уровень оттока может быть признаком неудовлетворенности клиентов, низкий уровень оттока, наоборот, может свидетельствовать о лояльности и удовлетворенности клиентов.

Теперь давайте продемонстрируем возможности когортного анализа, запустив анализ оттока для приложения на основе подписки, которое хочет проанализировать поведение своих клиентов в 2023 году.

Шаг 1 — Понимание вашего набора данных

В этом примере мы будем работать с таблицей subscriptions, хранящейся в BigQuery. Он содержит список подписок, сделанных в нашем продукте, включая дату регистрации и, самое главное, информацию об их состоянии, активна или отменена. Вот как выглядит таблица:

Теперь вы хотите посмотреть на эволюцию оттока ежемесячно. Вы можете сделать это, используя следующий запрос, взяв количество потерянных клиентов в месяц и разделив их на общее количество клиентов за тот же период:

Хорошие новости, уровень оттока снизился за год. Но отражает ли это реальность? Боюсь, что нет. Взгляд на отток таким образом будет представлять только часть картины. Здесь вступают в действие когорты.

Шаг 2 — Преобразование данных

Помните, когорты — это группы, определяемые общей характеристикой, в данном случае датой регистрации. Итак, давайте разобьем его на разные когорты; пользователи, которые зарегистрировались в январе, пользователи, которые зарегистрировались в феврале, и так далее. И для каждой когорты мы хотим знать, сколько клиентов подписались и сколько отменили подписку в каждый период времени. Другими словами, сколько отменено через месяц, два месяца и т. д.

Для этого воспользуемся следующим запросом:

Этот запрос вернет всего 78 строк; 12 — январь, 11 — февраль, 10 — март и так далее. Вот визуальная подсказка, которая поможет вам лучше понять результаты:

Теперь давайте разберем каждое из полей в результатах запроса:

  • signup_date: дата регистрации клиентов.
  • cancellation_date: дата, когда клиенты отменили заказ.
  • cohort_month: разница между signup_date и cancellation_date в месяце.
  • max_subscriptions: общее количество клиентов, зарегистрировавшихся в этом месяце.
  • sum_cancellations: количество клиентов, которые ежемесячно отменяли свои подписки.
  • r_sum_cancellations: текущая сумма участников, которые отменили свои подписки с течением времени. Это поле понадобится нам позже при построении нашей визуализации.

Например, глядя на строку номер 5, мы видим, что из 67 клиентов, подписавшихся в январе, 2 из них отменили свою подписку в мае, через четыре месяца после присоединения к услуге, в общей сложности 10 клиентов отменили подписку в период с января по январь. Может.

Шаг 3 — Объединяем все это в Looker Studio

Теперь, когда наш набор данных готов, давайте воспользуемся им для визуализации когорт в Looker Studio.

Во-первых, давайте создадим новое вычисляемое поле с именем churn_rate, используя следующую формулу:

SUM(r_sum_cancellations)/MAX(max_subscriptions)

Затем создадим новую диаграмму Сводная таблица со следующими критериями:

  • Размер строки: signup_date
  • Размер столбца: cohort_month
  • Показатель: churn_rate в процентах.
  • Сортировка №1: signup_date По возрастанию
  • Сортировка столбца №1: cohort_month По возрастанию

Чтобы добавить больше контекста на вашу панель инструментов, давайте добавим таблицу с общим количеством подписок слева от когортной диаграммы. Для этого создайте новую диаграмму Таблица со следующими критериями:

  • Размер: signup_date
  • Показатель: max_subscriptions с агрегацией Max.
  • Сортировка: signup_date По возрастанию

Добавляем немного форматирования и вуаля!

Глядя на отток таким образом, мы можем сделать быстрые выводы относительно вовлеченности пользователей. Например, когорта за апрель 2023 года превзошла все остальные когорты. Другими словами, группа с самым низким показателем оттока указывает на то, что клиенты, присоединившиеся в апреле, были более привержены и заинтересованы в продукте. Анализируя причины успеха этой когорты, мы можем использовать эти идеи для улучшения удержания и лояльности клиентов в будущем.

Заключение

Когортный анализ необходим для любого бизнеса, основанного на подписке, который хочет отслеживать поведение и отток клиентов. Это дает ценную информацию для принятия обоснованных решений по маркетингу и стратегии удержания, что приводит к увеличению доходов и удовлетворенности клиентов. Следуя шагам, описанным в этой статье, вы готовы внедрить когортный анализ и начать пользоваться его преимуществами. Удачного анализа!

Ресурсы

[1] Google Таблицы, medium_cohorts_dataset_public (2023), Дэмиен Аззопарди.

[2] Looker Studio, Medium — Cohort Analysis Looker Studio (2023), Дэмиен Аззопарди.