Задача системы рекомендаций (6/50)
Почему эта статья?
RecSys’14 и самый популярный документ по системе рекомендаций.
Какую проблему они решают?
Система рекомендаций со временем ожидания и вычисление времени ожидания является показателем долгосрочной удовлетворенности пользователей.
Как решить эту проблему?
Если у меня есть информация о времени задержки, наивная идея предсказать время задержки вместо предсказания клика. Как и в случае с этой бумагой на YouTube, они предсказывают время просмотра.
Другая идея заключается в том, чтобы рассматривать время задержки как функцию.
Что другие считают долгосрочной пользовательской ценностью?
Большинство исследователей рассматривают рейтинг и клик. Там мало рейтинга и много шумового клика.
Что такое базовые модели?
Нажмите в качестве цели: (GBDT) Gradient Boosted Decision Tree в качестве модели и нажмите в качестве цели.
Какую модель они предлагают?
Время ожидания в качестве цели. При той же настройке модели их целью является время ожидания, а не клики.
Время ожидания в качестве веса: при той же настройке модели они задают время ожидания в качестве веса экземпляра. Для большего времени задержки клика они дают больше веса.
Преимущества:
- Это может улучшить CTR, даже не оптимизируя функцию потери кликов.
- Это повышает вовлеченность пользователей.
Эксперименты, которые они проводят
Офлайн-эксперимент
Dwell Time as Wight работает лучше всего.
Интернет-эксперимент
А: линейная модель
B: модель GBDT (Y: щелчок)
C: модель GBDT (Y: время выдержки)
Не только CTR, но и вовлеченность пользователей, модель C работает лучше всего.
как можно использовать время ожидания в рамках CF для повышения производительности?
Они рассматривают парную целевую функцию.
Базовая модель: считать r кликом [0, 1]
Их модель: трактовать r как нормализованное время задержки [0, 6]
Метрика
MAP: среднее значение средней точности за весь сеанс пользователя.
NDCG:
Вот пример:
Если порядок рекомендаций [2, 3, 3, 1, 2]
в то время как идеальный порядок [3,3,2,2,1]
подробнее: вы можете следить за этим блогом.
ВЫВОДЫ
В этой статье не говорится о новой модели. В них рассматривается важность времени ожидания и то, как просто включить время ожидания в существующем моделировании.
Самыми популярными и простыми моделями являются обучение ранжированию и совместная фильтрация. Модель, основанная на времени ожидания, работает лучше, чем традиционная модель на обеих моделях.
Время ожидания может не только улучшить CTR (зарабатывая деньги для бизнеса), но и повысить вовлеченность пользователей (сделать их счастливыми).
P.S.
В этом документе также рассказывается о том, как измерить время задержки для различных устройств и как его нормализовать. Время задержки на стороне клиента обычно точнее, чем на стороне сервера.
Другие связанные блоги:
Надежные рекомендательные системы
Производительность рекомендательных алгоритмов на топ-n рекомендательных задачах
Матричная факторизация с распространением доверия для рекомендаций в социальных сетях
Скрытые факторы и скрытые темы: понимание параметров рейтинга с помощью текста отзыва
Лучшая бумага в RecSys:
Мой сайт: