Добро пожаловать во второй пост в нашей серии о рекомендательных системах на основе графов знаний. В нашем предыдущем посте мы представили свежий взгляд на процесс рекомендаций, используя возможности графа для структурирования соответствующих данных. При организации данных в графическом формате задача рекомендации рассматривается как задача прогнозирования ссылок.

В этом посте мы сначала представим графы знаний и то, как их можно использовать в рекомендательных системах для предоставления пользователям более точных и персонализированных рекомендаций. Затем мы углубимся в тему и рассмотрим некоторые ключевые компоненты рекомендательной системы на основе графа знаний. Мы обсудим, как данные собираются и организуются в графе знаний, как они используются для выработки рекомендаций, а также некоторые проблемы, связанные с разработкой такой системы.

Графики знаний (KG)

Термин «График знаний» был популяризирован Google в 2012 году для описания своей базы знаний, структурированной в виде графа, содержащей сотни миллионов сущностей и отношений. Он играет важную роль в поисковой системе компании с 2012 года, предоставляя подробные ответы на вопросы поисковых запросов, отображая боковую панель, содержащую конкретную информацию об объектах, упомянутых в запросах пользователей. В более общем плане граф знаний — это структурированная в виде графа база знаний, в которой хранится фактическая информация в форме взаимосвязей между сущностями (или буквальными значениями), что позволяет моделировать сущности реального мира и их отношения и, следовательно, обеспечивает поисковые системы и понимание естественного языка. системы и совсем недавно рекомендательные системы.

На следующем рисунке представлено графическое представление диаграммы знаний, которая включает разнообразную информацию о туризме, отдельных лицах и произведениях искусства, рассматриваемых как сущности. Отношения между этими объектами устанавливаются с помощью ссылок, которые указывают на их различные отношения, такие как "находится", "нарисовано" или "около". Эта форма представления знаний позволяет системе выявлять связи между объектами и генерировать рекомендации, которые более актуальны и персонализированы в соответствии с предпочтениями пользователей. Используя возможности этих соединений, рекомендательные системы на основе графов знаний могут обеспечить беспрецедентный уровень точности и четкости при рекомендации релевантных элементов пользователям.

Рекомендательные системы на основе Knowledge Graph

В последние годы графы знаний использовались в рекомендательных системах, чтобы преодолеть проблему разреженности взаимодействий пользователя и элемента и проблему холодного запуска, от которой страдают методы CF, используя свойства элементов и пользователей и представляя их в одной структуре данных.

На рисунке ниже показан фильм «График знаний» и показано, как пользователю u₂ можно предоставить рекомендацию на основе графа знаний.

Помимо простых списков свойств, уже управляемых предыдущими версиями рекомендательных систем, KG представляют и используют семантически богатые отношения между объектами. По конструкции KG легко могут быть связаны между собой. Например, было бы просто расширить график с рисунка выше, включив в него основные характеристики фильмов. Одной из замечательных особенностей рекомендательных систем KG является их способность использовать структуру KG для предоставления более качественных рекомендаций [1].

В целом, существующие рекомендации на основе КР можно разделить на две основные категории:

  • Методы на основе встраивания, которые являются подклассом рекомендательных систем на основе графа знаний, состоят в предварительной обработке KG с использованием алгоритмов встраивания графа знаний [2] и последующем включении встраивание изученных сущностей в рекомендательную структуру. Используя алгоритмы встраивания графа знаний, теперь можно превратить практически любой тип информации в вектор, который система может изучить. Например, [3], Zhang et al. предложить двухэтапный подход, который состоит в том, чтобы сначала вычислить вложения, поступающие из базы знаний, состоящей из структурных знаний, изображений и текста, представляющих элементы, а затем использовать сгенерированные вложения в качестве входных данных для алгоритма CF. В другой исследовательской работе [4] Zhang et al. использовать различные типы дополнительной информации об элементах (например, обзор, бренд, категория, купленные вместе и т. д.) для построения графа знаний, который впоследствии используется для построения элементов и вложений пользователей. На втором этапе рекомендательная система ранжирует элементы-кандидаты j в порядке возрастания расстояния между uᵢ и vⱼ. Подводя итог, можно сказать, что многие методы, основанные на внедрении, состоят из двух этапов: во-первых, изучаются внедрения сущностей (элементов, пользователей и т. д.); во-вторых, встраивания включаются в алгоритм обучения рекомендаций.

  • Методы на основе пути, которые исследуют различные модели связей между элементами в KG, чтобы предоставить дополнительные рекомендации для рекомендаций. Однако они в значительной степени полагаются на созданные вручную метапути, которые на практике трудно оптимизировать. В [5] Ю и соавт. использовать метод матричной факторизации для вычисления скрытого представления сущностей для различных подграфов, извлеченных из разнородного KG, а затем использовать метод агрегации для группировки всех сгенерированных скрытых представлений для вычисления вероятности рекомендации. Вдохновленные работой, предложенной в [5], Zhao et al. рассматривает КГ как гетерогенную информационную сеть (ГИН). Они извлекают скрытые функции на основе пути, чтобы представить связь между пользователями и элементами по различным типам путей отношений. Недостатком этих методов является то, что они обычно требуют экспертных знаний для определения типа и количества мета-путей. С развитием алгоритмов глубокого обучения были предложены различные модели для автоматического кодирования метапутей KG посредством встраивания, чтобы преодолеть вышеупомянутые ограничения.

Стоит упомянуть еще одну категорию рекомендательных систем KG. Эта категория рекомендательных систем рассматривает всю структуру KG, а не только триплеты KG. RippleNet, сквозная структура, которая естественным образом включает граф знаний в рекомендательные системы, была предложена в [7]. Подобно реальной ряби, распространяющейся по воде, RippleNet стимулирует распространение пользовательских предпочтений по набору объектов знаний, автоматически и итеративно расширяя потенциальные интересы пользователя по ссылкам в графе знаний.

Заключение

В заключение следует отметить, что графы знаний обеспечивают мощный способ структурирования данных для рекомендательных систем путем представления сущностей и их взаимосвязей в графическом формате. Были предложены различные методы рекомендательных систем на основе графов знаний, в том числе методы на основе путей, вложений и графовых сверточных сетей. Эти методы предлагают разную степень точности и масштабируемости в зависимости от размера и сложности графа знаний. Несмотря на очевидные проблемы, связанные с разработкой этих систем, рекомендательные системы на основе графов знаний открывают большие перспективы для предоставления пользователям более точных и персонализированных рекомендаций.

В следующем сообщении блога этой серии мы углубимся в тему алгоритмов встраивания KG. Мы обсудим, как эти алгоритмы используются для создания вложений, фиксирующих семантическое значение сущностей и их взаимосвязей в графе знаний. Это позволит лучше понять, как генерируются вложения KG и почему они полезны для рекомендательных систем. Оставайтесь с нами для следующего поста!

Использованная литература:

[1] Чжу Сунь, Цзе Ян, Цзе Чжан, Алессандро Боззон, Лонг-Кай Хуан и Чи Сюй. Повторяющееся встраивание графа знаний для эффективной рекомендации. В материалах 12-й конференции ACM по рекомендательным системам, RecSys ’18, стр. 297–305, Нью-Йорк, штат Нью-Йорк, США, 2018 г. Ассоциация вычислительной техники.

[2] Антуан Бордес, Николя Усюнье, Альберто Гарсия-Дюран, Джейсон Уэстон и Оксана Яхненко. Преобразование вложений для моделирования мультиреляционных данных. В CJC Burges, L. Bottou, M. Welling, Z. Ghahramani и KQ Weinberger, редакторы, Advances in Neural Information Processing Systems, Volume 26, Lake Tahoe, Nevada, United States, 2013. Curran Associates, Inc.

[3] Фучжэн Чжан, Николас Цзин Юань, Дэфу Лянь, Син Се и Вэй-Ин Ма. Встраивание совместной базы знаний для рекомендательных систем. В 22-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных, страницы 353–362, Нью-Йорк, штат Нью-Йорк, США, 2016 г. AC

[4] Юнфэн Чжан, Цинъяо Ай, Сюй Чен и Пэнфэй Ван. Изучение встраивания базы знаний для рекомендации. CoRR, абс/1803.06540, 2018.

[5] Сяо Юй, Сян Рен, Ичжоу Сунь, Цюаньцюань Гу, Брэдли Стерт, Урваши Хандельвал, Брэндон Норик и Цзявэй Хан. Индивидуальная рекомендация объекта: подход гетерогенной информационной сети. В материалах 7-й Международной конференции ACM по поиску в Интернете и интеллектуальному анализу данных, WSDM ’14, стр. 283–292, Нью-Йорк, штат Нью-Йорк, США, 2014 г. Ассоциация вычислительной техники.

[6] Хуан Чжао, Цюаньмин Яо, Цзянда Ли, Янцю Сун и Дик Лун Ли. Объединение рекомендаций на основе метаграфов в гетерогенных информационных сетях. В материалах 23-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных, KDD ’17, стр. 635–644, Нью-Йорк, штат Нью-Йорк, США, 2017 г. Ассоциация вычислительной техники.

[7] Хунвэй Ван, Фучжэн Чжан, Цзялинь Ван, Мяо Чжао, Вэньцзе Ли, Син Се и Миньи Го. 2018. RippleNet: распространение пользовательских настроек в сети знаний для рекомендательных систем. В материалах 27-й Международной конференции ACM по управлению информацией и знаниями (CIKM '18). Ассоциация вычислительной техники, Нью-Йорк, штат Нью-Йорк, США, 417–426.