Прогнозирование пожизненной ценности игроков в бесплатных мобильных играх

Всем привет, я Кутай Акалин. Я Data Scientist и соучредитель Funmetric. Я получил степень магистра в области больших данных и аналитики. Как Funmetric, мы считаем, что знания растут, когда ими делятся. Надеюсь, вам понравится наша статья :)

В этой статье мы поговорим о том, что такое Lifetime Value, как мы можем рассчитать LTV текущих игроков и предсказать его на основе поведения новых игроков. Мы объясним различные методы, такие как прогнозирование удержания, вероятностные модели и машинное обучение. Каждая модель имеет свои преимущества и недостатки в зависимости от вариантов использования. Но расчет и прогнозирование LTV является одним из важнейших ключей к построению стратегии устойчивого роста, и не существует общепризнанного подхода к расчету. Давайте углубимся в детали!

Что такое пожизненная ценность (LTV)?

Фактическая пожизненная ценность — один из самых важных показателей для понимания ценности вашей игры. По данным Эль-Насра и др. (2013) Пожизненная ценность — это общая сумма денег, которую пользователь внесет в конечный результат игры, пока он в ней участвует. Например, пожизненная ценность игрока в платных играх равна начальной цене покупки [1]. LTV игроков в играх на основе подписки рассчитывается каждый месяц, пока они остаются активными. В фримиум-играх нет общепринятого подхода к подсчету LTV игроков. Таким образом, большинство разработчиков используют свой собственный способ его расчета.

Каковы основные переменные LTV?

Для расчета LTV нам необходимо учитывать две основные переменные:

  • Монетизация
  • Срок службы (сохранение)

В бесплатных играх могут быть разные источники дохода для монетизации, такие как доходы от рекламы, покупки в приложении и подписки. Поэтому расчет LTV можно модифицировать в соответствии с долей дохода от ресурсов. Но, мы должны рассмотреть все эти источники с будущими целями. Если мы рассмотрим LTV с точки зрения удержания, большинство разработчиков считают сеансы игроков самым ценным временным окном на уровне игроков и рассчитывают их удержание в ежедневных когортах. Таким образом, измерение ежедневной активности и вовлеченности на основе этих игровых сессий становится проблематичным.

Что необходимо для расчета LTV

Во-первых, разработчики должны определить период времени, за который они хотят рассчитать ценность игроков, например:

  • День 7 LTV
  • День 30 LTV
  • День 180 LTV

На выбор этого периода влияет множество факторов, таких как жанр, бизнес-модель, стадия игры и ROI [2]. Кроме того, разработчики должны выбрать соответствующую метрику монетизации для использования в расчетах и ​​прогнозах.

Модели

Пожизненная ценность состоит из всех доходов, которые представляют собой сумму денежных средств конкретного игрока или определенной когорты. Выбор модели LTV можно изменить в зависимости от уровня прогнозирования (например, когорта или игрок) и наличия исторических данных.

Исторические отраслевые показатели

Если вы только что запустили свою игру и у вас нет данных, вы можете проанализировать ранее опубликованные аналогичные игры, поджанры и средние показатели по отрасли. При таком анализе можно линейно спроецировать будущее игры, но такой подход может не дать очень точных результатов [2].

Проектирование кривой удержания

Прогнозирование продолжительности жизни пользователя — один из самых популярных подходов к прогнозированию LTV. При таком подходе можно просто использовать регрессионный анализ. Наша цель состоит в том, чтобы подобрать кривую регрессии, которая минимизирует ошибку между фактическими точками и нашей кривой. Например, предположим, что вы находитесь на этапе мягкого запуска и хотите спрогнозировать 60-дневное удержание для когорты. На 14-й день вы вычисляете удержание 45% в день 1, 13% в день 7 и 8% в день 14. На основе этих значений вы можете построить нелинейную кривую, чтобы увидеть изменения:

Как видно на графике, коэффициент удержания на 60-й день прогнозируется на уровне 3,69%. С помощью нашей кривой удержания мы можем рассчитать LTV за определенный период по формуле:

Если наш ARPDAU равен 0,3$, а CPI = 1,5$, то наша точка безубыточности будет видна на рисунке ниже:

Конечно, это простой пример. Вы можете расширить этот анализ, создав модели для разных аудиторий, разных компаний, разных кривых удержания и так далее. Кроме того, вы даже можете использовать регрессионный анализ для анализа взаимосвязи между расходами и ИПЦ. Вы можете использовать этот анализ, чтобы оптимизировать рентабельность инвестиций для своей маркетинговой стратегии.

Попробуйте наш БЕСПЛАТНЫЙ инструмент, чтобы спрогнозировать LTV с помощью оптимизированных кривых удержания и проанализировать точку безубыточности!

Вероятностные модели

В вероятностных моделях мы пытаемся подобрать распределение вероятностей на основе значений RFM (новизна, частота и денежная величина) для прогнозирования покупательского поведения игроков. Обратите внимание, что при таком подходе переменные формулы LTV нельзя использовать в одной модели. Таким образом, мы должны построить две модели для прогнозирования двух основных переменных по отдельности: переменные транзакции (частота покупок и отток) и денежные переменные (средняя стоимость заказа) [3]. Некоторые из вероятностных моделей показаны ниже:

Среди этих моделей обычно используются модели Парето/NBD и BG/NBD.

Парето / НБГ

Шмитлайн и др. разработал модель Парето/NBD в 1983 году. Модель Парето/NBD пытается прогнозировать покупательское поведение отдельных игроков на основе предыдущих покупок. Для прогнозирования транзакций этот подход предполагает, что отток клиентов следует распределению Парето, а количество покупок активного игрока соответствует отрицательному биномиальному распределению (NBG). Следовательно, этот подход называется моделью Парето/НБГ. Эти распределения контролируются 4 основными параметрами: r и α для NBD, s и β для Парето. [4]

BG/NBD

Хотя модель Парето/NBD широко используется, ее трудно применять, поскольку оценка требует множественных оценок гипергеометрической функции Гаусса. Фейдер и др. предложил моделировать поведение игрока с помощью бета-геометрической модели, которая легче находит оптимизированные параметры и работает быстрее. Как и модель Парето/NBD, BG/NBD использует четыре параметра и предполагает, что игроки совершают покупки в любой момент периода [4].

Для расчета LTV по вероятностной модели необходимо выполнить 4 основных шага:

  1. Обработка данных для извлечения значений RFM из необработанных данных.
  2. Настройте параметры транзакционной модели (Pareto/NBG или BG/NBD)
  3. Создайте модель для денежных переменных (гамма-гамма-распределение) и подгоните ее.
  4. Предсказать LTV для каждого игрока

Модели машинного обучения

Модели машинного обучения и глубокого обучения с каждым днем ​​становятся все более популярными. В частности, производительность этих алгоритмов весьма успешна по сравнению со статистическими моделями. Поскольку значение срока службы является числовым, мы можем использовать регрессионные модели в моделях контролируемого машинного обучения, если у нас есть исторические данные. Поскольку для моделей машинного обучения требуется большой объем данных, нам необходимо получить очищенные, обработанные данные для этапа построения модели. Для этой цели мы можем использовать методы генерации синтетических данных и передавать обучение, чтобы улучшить производительность нашей модели, если у нас недостаточно данных. Кроме того, при необходимости мы можем построить разные модели для разных денежных ресурсов.

Одним из основных преимуществ моделей машинного обучения является то, что мы можем использовать различные типы характеристик игроков для прогнозирования LTV в выбранный период. В вероятностных моделях мы можем использовать только древовидные переменные (новизна, частота и денежная). Но в моделях ML мы можем генерировать различные ценные функции, используя методы разработки функций из необработанных данных. Конечно, эти важные функции зависят от бизнес-модели, жанра игры и доступности данных.

Кроме того, создание модели машинного обучения требует множества шагов, от создания конвейера данных до развертывания и производства. Готовый к использованию AI Pack от Funmetrics автоматически строит этот конвейер, обрабатывает и исследует данные, генерирует значимые функции и возвращает результаты с высокой точностью, даже если у вас недостаточно данных.

Резюме

В этой статье мы кратко объяснили модели прогнозирования жизненного цикла игроков в мобильных играх. Прогнозирование LTV новых игроков необходимо для различных подходов, таких как оптимизация распределения маркетингового бюджета, управление стратегией монетизации и расчет рентабельности инвестиций. По сути, мы можем выбрать подходящую модель, проверив доступность исторических данных и модель монетизации. Если у вас достаточно данных, модели машинного обучения могут генерировать более высокую точность, чем другие модели.

Пожалуйста, не стесняйтесь задавать любые вопросы через [email protected] или заказать бесплатный звонок. Увеличим вашу прибыль вместе!

использованная литература

[1] Эль-Наср, М.С., Драчен А. и Каносса А. (2013). Игровая аналитика: максимальное использование данных об игроках. Спрингер. DOI: 10.1007/978–1–4471–4769–5

[2] Monereo, I. (nd). Инсайты для оценки пожизненной ценности для разработчиков игр. Общение с разработчиками Google Play.

[3] Google Play. Подробное руководство по прогнозированию пожизненной ценности клиента (CLV). Получено с https://www.analyticsvidhya.com/blog/2020/10/a-definitive-guide-for-predicting-customer-lifetime-value-clv/

[4] Центр облачной архитектуры. Прогнозирование пожизненной ценности клиента с помощью платформы ИИ: введение. Получено с https://cloud.google.com/architecture/clv-prediction-with-offline-training-intro