Задача системы рекомендаций (6/50)

Бумажная ссылка

Почему эта статья?

RecSys’14 и самый популярный документ по системе рекомендаций.

Какую проблему они решают?

Система рекомендаций со временем ожидания и вычисление времени ожидания является показателем долгосрочной удовлетворенности пользователей.

Как решить эту проблему?

Если у меня есть информация о времени задержки, наивная идея предсказать время задержки вместо предсказания клика. Как и в случае с этой бумагой на YouTube, они предсказывают время просмотра.

Другая идея заключается в том, чтобы рассматривать время задержки как функцию.

Что другие считают долгосрочной пользовательской ценностью?

Большинство исследователей рассматривают рейтинг и клик. Там мало рейтинга и много шумового клика.

Что такое базовые модели?

Нажмите в качестве цели: (GBDT) Gradient Boosted Decision Tree в качестве модели и нажмите в качестве цели.

Какую модель они предлагают?

Время ожидания в качестве цели. При той же настройке модели их целью является время ожидания, а не клики.

Время ожидания в качестве веса: при той же настройке модели они задают время ожидания в качестве веса экземпляра. Для большего времени задержки клика они дают больше веса.

Преимущества:

  1. Это может улучшить CTR, даже не оптимизируя функцию потери кликов.
  2. Это повышает вовлеченность пользователей.

Эксперименты, которые они проводят

Офлайн-эксперимент

Dwell Time as Wight работает лучше всего.

Интернет-эксперимент

А: линейная модель

B: модель GBDT (Y: щелчок)

C: модель GBDT (Y: время выдержки)

Не только CTR, но и вовлеченность пользователей, модель C работает лучше всего.

как можно использовать время ожидания в рамках CF для повышения производительности?

Они рассматривают парную целевую функцию.

Базовая модель: считать r кликом [0, 1]

Их модель: трактовать r как нормализованное время задержки [0, 6]

Метрика

MAP: среднее значение средней точности за весь сеанс пользователя.

NDCG:

Вот пример:

Если порядок рекомендаций [2, 3, 3, 1, 2]

в то время как идеальный порядок [3,3,2,2,1]

подробнее: вы можете следить за этим блогом.

ВЫВОДЫ

В этой статье не говорится о новой модели. В них рассматривается важность времени ожидания и то, как просто включить время ожидания в существующем моделировании.

Самыми популярными и простыми моделями являются обучение ранжированию и совместная фильтрация. Модель, основанная на времени ожидания, работает лучше, чем традиционная модель на обеих моделях.

Время ожидания может не только улучшить CTR (зарабатывая деньги для бизнеса), но и повысить вовлеченность пользователей (сделать их счастливыми).

P.S.

В этом документе также рассказывается о том, как измерить время задержки для различных устройств и как его нормализовать. Время задержки на стороне клиента обычно точнее, чем на стороне сервера.

Другие связанные блоги:

Надежные рекомендательные системы

Производительность рекомендательных алгоритмов на топ-n рекомендательных задачах

Рекомендация Multiverse: N-мерная тензорная факторизация для контекстно-зависимой совместной фильтрации

Матричная факторизация с распространением доверия для рекомендаций в социальных сетях

Скрытые факторы и скрытые темы: понимание параметров рейтинга с помощью текста отзыва

Лучшая бумага в RecSys:

https://recsys.acm.org/best-papers/

Мой сайт:

https://light0617.github.io/#/