Загрузите технический документ Обнаружение облачных знаний в документах KDD, чтобы ознакомиться с 12 документами KDD и знаниями от 12 экспертов Alibaba.

Юкуо Цэнь, Цзяньвэй Чжан, Сюй Цзоу, Чан Чжоу, Хунся Ян, Цзе Тан

Этот документ «Контролируемая мультиинтересная структура рекомендаций» был принят KDD 2020.

В последнее время нейронные сети широко используются в рекомендательных системах электронной коммерции. Алгоритм рекомендаций на основе нейронной сети обычно изучает только один вектор представления пользователя из последовательности поведения пользователя. В большинстве случаев этот единый вектор представления не может отражать различные интересы пользователя в течение определенного периода времени. Как показано на следующем рисунке, последовательность кликов Эммы отражает три ее недавних увлечения: украшения, сумки и косметика. Мы предлагаем управляемую мультиинтересную структуру ComiRec для рекомендаций, которая используется для рекомендации товаров на основе последовательности кликов пользователя. Модуль извлечения нескольких интересов фиксирует различные интересы пользователя из последовательности кликов этого пользователя. Эти интересы можно использовать для припоминания похожих предметов. Модуль агрегации объединяет отозванные элементы в список элементов-кандидатов для рекомендации, которые будут использоваться последующими задачами.

Мы разработали модуль извлечения с несколькими интересами со ссылкой на существующую работу по сетям с несколькими интересами и динамической маршрутизацией (MIND) [1]. Модель MIND извлекает множественные интересы пользователя, используя алгоритм динамической маршрутизации между капсульными сетями [2]. Чтобы реализовать модуль извлечения нескольких интересов, мы исследовали алгоритм динамической маршрутизации и подход, основанный на самоконтроле. Необходимы дальнейшие исследования, чтобы определить оптимальный выбор для реализации этого модуля. Модуль извлечения нескольких интересов обучается путем прогнозирования следующих кликов пользователя на основе исторической последовательности кликов этого пользователя. В частности, для выборки пары (u, i) в обучающем наборе мы можем получить несколько представлений пользователя u v_1, v_2,…, v_K, проанализировав последовательность щелчков этого пользователя до того, как этот пользователь щелкнет элемент i. Затем мы выбираем пользовательское представление v_t, наиболее близкое к представлению e_i элемента i. Оптимизирована следующая функция отрицательного логарифмического правдоподобия:

где I — совокупность элементов. Формула суммирования в знаменателе приводит к чрезмерным затратам на вычисления. Поэтому мы используем метод softmax на основе выборки для приблизительных расчетов. После обучения модуль извлечения нескольких интересов может изучить несколько представлений пользователя из исторической последовательности кликов пользователя. На следующем рисунке показан процесс обучения модуля.

Чтобы проверить эффективность модуля извлечения нескольких интересов, мы провели эксперименты на двух общедоступных наборах данных с Amazon и Taobao. Согласно статистике, приведенной в следующей таблице, наш подход ComiRec-SA/DR обеспечивает оптимальный эффект на основе обоих наборов данных. SA указывает на метод самообслуживания, а DR указывает на метод динамической маршрутизации.

Мы провели кейс, основанный на реальных интересах пользователя. Модуль извлечения нескольких интересов узнает четыре недавних интереса пользователя из исторической последовательности кликов пользователя, включая сладости, подарочные коробки, чехлы для телефонов и аксессуары. Как показано на следующем рисунке, в левой части перечислены элементы, по которым щелкнул пользователь, а в правой части перечислены некоторые элементы, отозванные из большого пула элементов на основе представлений интересов пользователя.

Важно найти способ, позволяющий нижестоящим задачам использовать эти мультиинтересные представления. Для этого мы предлагаем модуль управляемой агрегации. Учитывая представления пользователя о множественных интересах v_1,v_2,…,v_K, наиболее прямой подход к их анализу состоит в том, чтобы определить сходство элемента и пользователя как показатель представления интересов, наиболее релевантного элементам, то есть

. Этот подход может максимизировать точность рекомендаций, но не позволяет в полной мере использовать представление множественных интересов. Управляемый модуль агрегации может регулировать точность и разнообразие рекомендаций на основе представления нескольких интересов. Мы определяем следующую функцию значения, которая показывает взаимосвязь между пользователем u и набором элементов S:

где g(i,j) обозначает разницу между элементами i и j, например, g(i,j)=δ(CATE(i)≠CATE(j)). CATE(i) обозначает категорию пункта i. δ(⋅) — индикаторная функция. Мы выбрали набор элементов S из элементов, которые были отозваны на основе представления интересов. Это максимизировало функцию ценности Q(u,S), что позволило нам получить набор рекомендуемых элементов. Мы можем использовать жадную стратегию, чтобы получить лучшее решение для этой функции. Алгоритм аппроксимации следующий:

В настройках гиперпараметра, если вы хотите максимизировать точность рекомендаций, установите λ=0. Это имеет тот же эффект, что и самый прямой подход, упомянутый выше. При λ=+∞ модуль агрегации находит самый разнообразный набор элементов. Мы протестировали модуль управляемой агрегации на наборе данных от Amazon. По мере увеличения фактора λ показатель отзыва для рекомендации немного снижается, но разнообразие рекомендуемых элементов значительно увеличивается. Увеличение разнообразия рекомендуемых элементов может в определенной степени улучшить пользовательский опыт.

использованная литература

[1] Ли, Чао и др. «Многопрофильная сеть с динамической маршрутизацией для рекомендации на Tmall». Материалы 28-й Международной конференции ACM по управлению информацией и знаниями. 2019.
[2] Сабур, Сара, Николас Фросс и Джеффри Э. Хинтон. «Динамическая маршрутизация между капсулами». Достижения в области нейронных систем обработки информации. 2017.

Мнения, выраженные здесь, приведены только для справки и не обязательно отражают официальную точку зрения Alibaba Cloud.

Оригинальный источник: