Демистификация когортного анализа, шаг за шагом
Введение
Давайте признаем это; когортный анализ может показаться пугающим на первый взгляд. Тем не менее, это мощный инструмент, который может дать ценную информацию, а иногда и единственный правильный способ визуализации данных. Их освоение даст вам явное преимущество в вашем путешествии по аналитике данных.
Но сначала, что мы подразумеваем под когортным анализом?
Когортный анализ — это способ изучения и сравнения различных групп людей во времени.
Эти группы определяются общей характеристикой, например датой подключения к службе или первой покупки.
Когортный анализ часто используется для анализа того, насколько клиенты прекращают свои отношения с продуктом или услугой, понятие, обычно называемое «оттоком». Для компаний, использующих подписку, отток представляет собой процент клиентов, отменивших свои подписки в течение заданного периода.
Отток — это важный бизнес-показатель, который может значительно повлиять на доход и рост. В то время как высокий уровень оттока может быть признаком неудовлетворенности клиентов, низкий уровень оттока, наоборот, может свидетельствовать о лояльности и удовлетворенности клиентов.
Теперь давайте продемонстрируем возможности когортного анализа, запустив анализ оттока для приложения на основе подписки, которое хочет проанализировать поведение своих клиентов в 2023 году.
Шаг 1 — Понимание вашего набора данных
В этом примере мы будем работать с таблицей subscriptions
, хранящейся в BigQuery. Он содержит список подписок, сделанных в нашем продукте, включая дату регистрации и, самое главное, информацию об их состоянии, активна или отменена. Вот как выглядит таблица:
Теперь вы хотите посмотреть на эволюцию оттока ежемесячно. Вы можете сделать это, используя следующий запрос, взяв количество потерянных клиентов в месяц и разделив их на общее количество клиентов за тот же период:
Хорошие новости, уровень оттока снизился за год. Но отражает ли это реальность? Боюсь, что нет. Взгляд на отток таким образом будет представлять только часть картины. Здесь вступают в действие когорты.
Шаг 2 — Преобразование данных
Помните, когорты — это группы, определяемые общей характеристикой, в данном случае датой регистрации. Итак, давайте разобьем его на разные когорты; пользователи, которые зарегистрировались в январе, пользователи, которые зарегистрировались в феврале, и так далее. И для каждой когорты мы хотим знать, сколько клиентов подписались и сколько отменили подписку в каждый период времени. Другими словами, сколько отменено через месяц, два месяца и т. д.
Для этого воспользуемся следующим запросом:
Этот запрос вернет всего 78 строк; 12 — январь, 11 — февраль, 10 — март и так далее. Вот визуальная подсказка, которая поможет вам лучше понять результаты:
Теперь давайте разберем каждое из полей в результатах запроса:
signup_date
: дата регистрации клиентов.cancellation_date
: дата, когда клиенты отменили заказ.cohort_month
: разница междуsignup_date
иcancellation_date
в месяце.max_subscriptions
: общее количество клиентов, зарегистрировавшихся в этом месяце.sum_cancellations
: количество клиентов, которые ежемесячно отменяли свои подписки.r_sum_cancellations
: текущая сумма участников, которые отменили свои подписки с течением времени. Это поле понадобится нам позже при построении нашей визуализации.
Например, глядя на строку номер 5, мы видим, что из 67 клиентов, подписавшихся в январе, 2 из них отменили свою подписку в мае, через четыре месяца после присоединения к услуге, в общей сложности 10 клиентов отменили подписку в период с января по январь. Может.
Шаг 3 — Объединяем все это в Looker Studio
Теперь, когда наш набор данных готов, давайте воспользуемся им для визуализации когорт в Looker Studio.
Во-первых, давайте создадим новое вычисляемое поле с именем churn_rate
, используя следующую формулу:
SUM(r_sum_cancellations)/MAX(max_subscriptions)
Затем создадим новую диаграмму Сводная таблица со следующими критериями:
- Размер строки:
signup_date
- Размер столбца:
cohort_month
- Показатель:
churn_rate
в процентах. - Сортировка №1:
signup_date
По возрастанию - Сортировка столбца №1:
cohort_month
По возрастанию
Чтобы добавить больше контекста на вашу панель инструментов, давайте добавим таблицу с общим количеством подписок слева от когортной диаграммы. Для этого создайте новую диаграмму Таблица со следующими критериями:
- Размер:
signup_date
- Показатель:
max_subscriptions
с агрегацией Max. - Сортировка:
signup_date
По возрастанию
Добавляем немного форматирования и вуаля!
Глядя на отток таким образом, мы можем сделать быстрые выводы относительно вовлеченности пользователей. Например, когорта за апрель 2023 года превзошла все остальные когорты. Другими словами, группа с самым низким показателем оттока указывает на то, что клиенты, присоединившиеся в апреле, были более привержены и заинтересованы в продукте. Анализируя причины успеха этой когорты, мы можем использовать эти идеи для улучшения удержания и лояльности клиентов в будущем.
Заключение
Когортный анализ необходим для любого бизнеса, основанного на подписке, который хочет отслеживать поведение и отток клиентов. Это дает ценную информацию для принятия обоснованных решений по маркетингу и стратегии удержания, что приводит к увеличению доходов и удовлетворенности клиентов. Следуя шагам, описанным в этой статье, вы готовы внедрить когортный анализ и начать пользоваться его преимуществами. Удачного анализа!
Ресурсы
[1] Google Таблицы, medium_cohorts_dataset_public (2023), Дэмиен Аззопарди.
[2] Looker Studio, Medium — Cohort Analysis Looker Studio (2023), Дэмиен Аззопарди.