Модульное прогнозирование редких событий для повышения рентабельности инвестиций

Мы в RevX стремимся обеспечить хорошую рентабельность инвестиций для наших рекламных партнеров. Большинство наших клиентов измеряют рентабельность инвестиций с точки зрения eCPA (цена за приобретение). Технология RevX разумно покупает медиа на программных биржах, а модели прогнозирования играют центральную роль в достижении двойной цели: обеспечить хорошую рентабельность инвестиций для клиентов и обеспечить бизнесу стабильную прибыль.

Сложная часть: прогнозирование событий покупки

Одним из возможных подходов к обеспечению хорошей рентабельности инвестиций может быть построение модели прогнозирования для события покупки, а затем использование этой модели непосредственно для ставок со значением ставки = цель CPA x вероятность покупки (без оптимизации выплат по кликам). Однако события покупки происходят очень редко и, следовательно, их трудно предсказать. Как правило, 1 из 10 000 показов может привести к покупке. Следовательно, для положительного класса не хватает обучающих выборок.

Мы внутренне экспериментируем со многими подходами и алгоритмами для решения этой сложной проблемы. Одним из таких подходов является избыточная выборка редкого класса/события, а затем повторная корректировка прогнозов с коэффициентом избыточной выборки. Однако, по нашему опыту, избыточная выборка не оказалась эффективным методом, когда речь идет о прогнозировании редких событий, таких как покупка/продажа.

Мощные модели: благословение или проклятие?

Если мы хотим иметь большую мощность прогнозирования, используя больше сигналов данных, надеясь, что, возможно, сложная модель сможет «мощно» изучать редкие события, это может усугубить ситуацию. «Проклятие размерности» вызовет больше проблем, особенно для проблемы редких событий. Чтобы научиться достаточно хорошо, модели потребуются огромные объемы обучающих данных. Мы экспериментировали с этим методом, когда для прогнозирования события покупки использовалась одна модель с большим набором атрибутов, но такие модели не оправдали ожиданий с точки зрения качества и точности прогноза.

В конце концов мы приняли модульный подход, в котором мы разделили проблему на две части: используя одну модель для прогнозирования вероятности клика и используя вторую модель для оценки качества клика с точки зрения конверсии/ROI.

Подход RevX: мощная модель CTR + упрощенная модель конверсии

Мы используем довольно мощную модель предсказания кликов, которая предсказывает клики с хорошей AUC (показатель качества модели) и завышенными показателями предсказания. Эти модели достаточно стабильны и точны и используют различные атрибуты пользователя, издателя и кампании. Однако проблема с прогнозированием на основе кликов для кампаний, которые измеряют рентабельность инвестиций с точки зрения стоимости транзакции, заключается в том, что прогнозирование кликов не учитывает качество кликов. В мире мобильных приложений есть много приложений и форматов рекламы, которые дают высокий CTR, но не приводят к конверсии. Модель прогнозирования кликов будет предлагать высокие ставки для таких ресурсов с высоким CTR, и кампания в конечном итоге будет покупать показы по высокой цене, что приведет к более высокой цене за конверсию и более низкой рентабельности инвестиций.

RevX решает эту проблему, развертывая более простую модель для оптимизации рентабельности инвестиций. Мы не используем модель для прогнозирования коэффициентов конверсии с высокой точностью. Скорее, мы используем его только для фильтрации плохого инвентаря — инвентаря, который приводит к высокому CTR и низкому коэффициенту конверсии. Это также в значительной степени решает проблему мошенничества с кликами; клик не имеет ценности, если он не может стимулировать транзакцию и рентабельность инвестиций для клиентов.

Наличие более простой модели с несколькими важными сигналами решает проблему размерности, особенно при прогнозировании редкого события, такого как покупка. Более того, смещение роли модели конверсии с ценообразования ставок на фильтрацию ставок значительно снижает нагрузку на прогнозирование сложной для изучения модели.

В RevX мы постоянно изучаем и экспериментируем с новыми методами обработки данных, чтобы сделать цифровую рекламу более интеллектуальной и эффективной.

Автор: Рагхав Гаи, ведущий специалист по данным

Подробнее о блогах: revx.io/blogs

Подпишитесь на RevX в Twitter| Нравится нам на Facebook| Подпишитесь на нас в LinkedIn

Первоначально опубликовано на: revx.io