Задача системы рекомендаций (3/50)

Бумажная ссылка

Почему эта статья?

RecSys’10 и самая популярная система рекомендаций.

Вместо популярной матричной факторизации они применяют тензорную факторизацию, которая легко включает контекстную информацию.

Данные?

Показатель?

MAE

Какую проблему они хотят решить? Модель рейтинга сизменением времени (контекста) пользовательских предпочтений

Они применили MAE для измерения производительности рейтинга.

Как другие решают эту проблему?

Мы можем получить все больше и больше контекстной информации, такой как мобильное местоположение, время.

Традиционные исследователи применяли

контекстная предварительная фильтрация:контекст определяет выбор данных

контекстная предварительная фильтрация: фильтрация элементов после завершения их моделирования.

контекстное моделирование: контекст интегрирован в моделирование.

В последнее время модели факторизации стали одним из предпочтительных подходов к совместной фильтрации. timeSVD++ лучше, чем невременная модель SVD.

Другие авторы также ввели время в качестве конкретной факторной модели.

Байесовская вероятностная модель TF, чтобы отразить временную эволюцию предпочтений онлайн-покупок.

Рекомендация по совместному тегу: пользователь, элемент, модель тега для представления целевой переменной, которая в их случае является тегом, закодированным как двоичный вектор.

HOSVD-разложение: разложение по единственному значению высокого порядка

Взносы?

  • Компактно обобщить эффективные подходы МФ к N-мерному случаю.
  • Включите любое количество контекстных измерений в саму модель
  • Воспользуйтесь преимуществами нескольких функций потерь, разработанных для точной настройки критериев оптимизации.
  • Обучите модель с помощью быстрого и простого алгоритма
  • Воспользуйтесь преимуществами разреженности данных, но при этом используйте взаимодействие между всеми пользовательскими элементами и контекстом.

Какую модель они предлагают? МУЛЬТИВЕРСНАЯ РЕКОМЕНДАЦИЯ

Отличие от существующего метода HOSVD:

  1. ЗАПРЕЩАЕТСЯ рассматривать отсутствующие как 0, избегая предвзятости в отношении ненаблюдаемых. Существующие методы ХОСВД нуждаются в плотной матрице.
  2. Применение регуляризованного
  3. НЕТ необходимости ограничивать ортогональность факторов

Преимущества:

  1. Нет необходимости в предварительной или постфильтрации: раздельная, предварительная, постфильтрация обычно приводит к потере информации о взаимодействии
  2. Вычислительная простота
  3. Способность обрабатывать N-измерения

Функция потери:

Регуляризация

Избегайте переоснащения, они также выполняют регуляризацию

Поэтому их целевая функция:

Они применяют Subspace descent (оптимизированный один и фиксированный другой) и SGD (приличный стохастический градиент).

Как обработать недостающую информацию?

Они применяют все или нулевую стратегию.

  1. ноль: обновить U и M с пропуском всего контекста
  2. all: обновить U и M с обновлением всего контекста, используя размер шага для контроля скорости обновления

Базовая модель

Сокращение: классическая совместная фильтрация с контекстной информацией для представления пользователей и элементов на основе OLAP.

Разделение: устраняет вычислительные проблемы подходов, основанных на сокращении, и обеспечивает более динамичное решение.

Эксперимент

Они также применяют полусинтетические данные на Yahoo.

Результат

Другие связанные блоги:

Надежные рекомендательные системы

Производительность рекомендательных алгоритмов на топ-n рекомендательных задачах

Лучшая бумага в RecSys:

https://recsys.acm.org/best-papers/

Мой веб-сайт:

https://light0617.github.io/#/