Системы рекомендаций на основе глубокого обучения

Глубокое обучение (DL) имело огромный успех за последние несколько лет в таких областях, как компьютерное зрение и распознавание речи. В последнее время методы DL также использовались для повышения производительности рекомендательных систем (RS). Большинство крупных веб-сайтов и сервисов используют RS, улучшенный с помощью DL, в постоянной попытке улучшить общий пользовательский интерфейс. Netflix рекомендует, какие шоу смотреть дальше, YouTube предлагает вам видео, Google Play предлагает другие приложения, которые могут вам понравиться, и даже текстовые сервисы, такие как Yahoo News, используют нейронные сети для предоставления рекомендаций миллионам пользователей. Давайте проанализируем лежащие в основе технологии и поймем, почему Deep Learning - правильный выбор для рекомендательных систем.

Почему компании вообще беспокоятся о рекомендательных системах?

Мы живем в эпоху цифровых технологий, когда ежедневно создаются огромные объемы данных и контента. Учитывая, из скольких вариантов предметов можно выбрать, пользователи могут легко страдать от паралича выбора. Именно здесь вступает в действие RS, помогая сузить поток продуктов на основе индивидуальных предпочтений пользователя.

Вы когда-нибудь заканчивали смотреть хорошее шоу на Netflix и сразу же находили что-то интересное в рекомендованном разделе? Вот и хороший RS делает свое дело.

Согласно статистике самого Netflix, пользователи в 2–4 раза чаще просматривают контент в верхней части рекомендованного списка, если он персонализированный, в отличие от общего «популярного» списка, который одинаков для всех. В целом, 2 из каждых 3 часов потоковой передачи на Netflix обнаруживаются через домашнюю страницу из рекомендованного списка. RS в целом влияет на выбор около 80% часов потоковой передачи в Netflix, тогда как оставшиеся 20% приходятся на функцию поиска.

YouTube - еще один яркий пример успешного использования RS: из миллионов доступных видео системе удается предоставлять пользователям контент, соответствующий их предпочтениям. Их система делает это в два этапа:

На основе истории пользователей RS выполняет генерацию кандидатов, переходя от миллионов видео к сотням.
Еще больше сужая использование функций видео и других источников, система ранжирует кандидатов и выводит около дюжины видео из верхней части списка.

В итоге на рекомендации приходится около 60% всех кликов по видео с главной страницы. Раздел связанных видео также вызывает высокую корреляцию между просмотрами видео и просмотрами его видео с ведущими реферерами. Коэффициент корреляции равен 0,60, что указывает на то, насколько хорошо RS выбирает релевантные видео.

Как глубокое обучение может улучшить рекомендательные системы?

По своей сути RS основаны на таких методах, как совместная фильтрация, фильтрация на основе содержимого или их сочетание. Однако они не лишены недостатков. Огромное количество контента и пользователей затрудняют построение точных прогнозов, особенно когда у пользователей короткая история взаимодействия или когда определенные элементы не так популярны. Техники DL объединяют в себе несколько сильных сторон:

Нелинейное преобразование. Обычные методы, такие как матричная факторизация, являются линейными моделями. Используя глубокие нейронные сети, RS может моделировать нелинейные эффекты и фиксировать сложные шаблоны взаимодействия пользователя с элементом.
Репрезентативное обучение. В реальных приложениях обычно имеется много описательной информации об элементах и пользователях, которую нейронные сети могут использовать для лучшего их понимания. В результате меньше усилий тратится на дизайн функций, и система может учиться на существенной информации, такой как текст и изображения, вместо того, чтобы основываться исключительно на кликах, обзорах и покупках.
Последовательное моделирование. Несколько задач последовательного моделирования, таких как машинный перевод и распознавание речи, были успешными благодаря внедрению DL. Это находит важные приложения в понимании временной динамики поведения пользователей и эволюции элементов.
Гибкость. Доступен широкий спектр инструментов DL (Tensorflow, Keras, Caffe и т. д.), большинство из которых имеют активное сообщество, профессиональную поддержку и разработаны по модульному принципу. Модульность повышает эффективность разработки, упрощая создание гибридных моделей.

В зависимости от того, как они построены, современные DL RS подразделяются на две категории: 1) рекомендация с нейронными строительными блоками (с использованием одной модели DL); 2) Рекомендация с глубокими гибридными моделями (одновременное использование нескольких методов DL).

Из различных строительных блоков два выделяются в зависимости от их важности и частоты использования - сверточные нейронные сети и рекуррентные нейронные сети.

CNN

Сверточные нейронные сети (CNN) - это форма сети, основанная на визуальном восприятии животных. Начиная с нижних слоев, которые изучают основные характеристики, такие как края, сеть постепенно представляет объект в чертах более высокого порядка, таких как глаза на лице или автомобили на улице. Визуальные особенности предмета имеют большое значение в моде, розничной торговле и развлечениях, поэтому распознавание этих особенностей и группирование предметов - хороший способ помочь пользователям найти предметы, похожие на то, что им нравится.

Когда в систему вводятся новые элементы, рекомендатели сталкиваются с так называемой «проблемой холодного старта», когда доступны очень ограниченные данные о контенте. CNN помогают решить эту проблему, группируя новые элементы с существующими на основе их характеристик. Следует отметить, что это используется не только для визуального представления. Spotify использует CNN для извлечения звуковых функций из песен и добавления новых треков и исполнителей в пользовательские плейлисты.

РНС

Рекуррентные нейронные сети (RNN) лучше всего подходят для последовательной обработки данных. В отличие от нейронных сетей прямого распространения, RNN могут использовать свою внутреннюю память для обработки произвольных последовательностей входных данных. Это идеально подходит для ситуаций, когда пользователи не входят в систему, а рекомендательная система должна делать прогнозы на основе очень разреженных данных, хранящихся в файлах cookie. Узнавая о кликах пользователей, сеть дает прогнозы относительно краткосрочных решений пользователя, т. Е. Их следующего клика. Это очень недооцененное применение нейронных сетей.

Естественно, те же преимущества еще более заметны при принятии долгосрочных решений. Если пользователь действительно входит на веб-сайт, RNN теперь имеет доступ ко всей истории решений, что позволяет лучше прогнозировать, что пользователю понравится в будущем.

Системы рекомендаций на основе глубокого обучения - ИИ обучения

Почему компании вообще беспокоятся о рекомендательных системах?

Как глубокое обучение может улучшить рекомендательные системы?

CNN

РНС

Рекомендуемый ИИ, предлагаемый RealityEngines

Системы рекомендаций на основе глубокого обучения - ИИ обучения

Почему компании вообще беспокоятся о рекомендательных системах?

Как глубокое обучение может улучшить рекомендательные системы?

CNN

РНС

Рекомендуемый ИИ, предлагаемый RealityEngines

Вопросы по теме