Искусственный интеллект (ИИ) и машинное обучение (МО) становятся обычным явлением. Они используются для выполнения задач и помогают принимать важные решения в самых разных отраслях, включая энергетику, медицину и финансовый сектор.

Среди прочего, системы рекомендаций по мощности AI и ML. Эти системы рекомендуют продукты, контент или услуги, которые могут понравиться потребителям, независимо от того, совершают ли они покупки в Интернете, выбирают фильм или песню для потоковой передачи или просматривают новостные статьи.

Компании используют рекомендательные системы, потому что они помогают им персонализировать покупательский опыт, увеличить доход и улучшить удержание клиентов и лояльность к бренду. Потребители обычно ценят предложения, в которых выделяются элементы или функции, которые они, возможно, не рассматривали.

Типы рекомендательных систем

Существует три основных типа рекомендательных систем.

  1. Контентная фильтрация использует сходство продуктов, услуг или функций контента, а также информацию, накопленную о пользователе, для выработки рекомендаций.
  2. Совместная фильтрация опирается на предпочтения похожих пользователей, чтобы предлагать рекомендации конкретному пользователю.
  3. Гибридные рекомендательные системы объединяют две или более рекомендательных стратегий, по-разному используя преимущества каждой из них для выработки рекомендаций.

В этой статье мы рассмотрим, в частности, рекомендательные системы на основе контента, в том числе то, как они работают, их преимущества и проблемы, а также навыки и технологии, которые могут вам понадобиться для начала их разработки.

Что такое контентная фильтрация и как она работает?

Контентная фильтрация — это тип рекомендательной системы, которая пытается угадать, что может понравиться пользователю, на основе его активности.

Контентная фильтрация дает рекомендации, используя ключевые слова и атрибуты, назначенные объектам в базе данных (например, товарам на онлайн-рынке), и сопоставляя их с профилем пользователя. Профиль пользователя создается на основе данных, полученных в результате действий пользователя, таких как покупки, рейтинги (нравится и не нравится), загрузки, элементы, найденные на веб-сайте и/или помещенные в корзину, и переходы по ссылкам на продукты.

Например, предположим, что вы рекомендуете аксессуары пользователю, который только что купил смартфон на вашем веб-сайте и ранее уже покупал аксессуары для смартфонов. Помимо ключевых слов, таких как производитель смартфона, марка и модель, в профиле пользователя указано, что предыдущие покупки включают в себя держатели для телефонов с отделениями для кредитных карт. На основе этой информации рекомендательная система может предложить аналогичные держатели телефонов для нового телефона с такими атрибутами, как слой ткани, блокирующий RFID, чтобы помочь предотвратить несанкционированное сканирование кредитных карт. В этом примере пользователь ожидал бы рекомендаций для аналогичных держателей телефонов, но функция блокировки RFID может быть чем-то, чего он не ожидал, но оценил.

Назначение атрибутов

Контентная фильтрация основана на присвоении атрибутов объектам базы данных, чтобы алгоритм знал что-то о каждом объекте. Эти атрибуты зависят в первую очередь от продуктов, услуг или контента, которые вы рекомендуете.

Назначение атрибутов может быть монументальной задачей. Многие компании прибегают к помощи групп экспертов в предметной области, чтобы вручную присвоить атрибуты каждому элементу. Например, Netflix нанял сценаристов для оценки шоу по различным аспектам, начиная от мест съемок и актеров и заканчивая сюжетными линиями, тоном и эмоциональными эффектами. Полученные теги, используемые рекомендателем, алгоритмически объединяются для группировки фильмов, имеющих схожие аспекты.

Создание профиля пользователя

Профили пользователей — еще один элемент, имеющий решающее значение для рекомендательных систем на основе контента. Профили включают в себя объекты базы данных, с которыми пользователь взаимодействовал — покупал, просматривал, читал, смотрел или слушал — а также назначенные им атрибуты.

Атрибуты, появляющиеся в нескольких объектах, имеют больший вес, чем те, которые появляются реже. Это помогает установить степень важности, поскольку не все атрибуты объекта равны пользователю. Отзывы пользователей также имеют решающее значение при взвешивании элементов, поэтому веб-сайты, предоставляющие рекомендации, постоянно просят вас оценить продукты, услуги или контент.

На основе взвешивания атрибутов и истории рекомендательная система создает уникальную модель предпочтений каждого пользователя. Модель состоит из атрибутов, которые могут понравиться или не понравиться пользователю на основе прошлых действий, взвешенных по важности. Пользовательские модели сравниваются со всеми объектами базы данных, которым затем присваиваются оценки на основе их сходства с профилем пользователя.

Вот пример: допустим, вы слушали «The Last Time» Тейлор Свифт, «Can't Remember to Forget You» Шакиры и «Me, Myself and I» Бейонсе. Система рекомендаций может распознать, что вам нравятся поп-исполнители женского пола и песни о расставании. Вы могли бы ожидать, что получите рекомендации по большему количеству песен о расставании от этих и других поп-исполнителей, таких как «Slide Away» Майли Сайрус.

Система рекомендаций также может предлагать различные типы песен Майли Сайрус, потому что вам нравятся поп-исполнители женского пола. Тем не менее, поскольку раньше вы не решали слушать этого исполнителя или песни, не связанные с расставанием, эти варианты получат более низкую оценку.

Зачем использовать контентную фильтрацию?

Контентная фильтрация имеет много преимуществ по сравнению с совместной фильтрацией, в том числе:

  • Никаких данных от других пользователей не требуется, чтобы начать давать рекомендации. В отличие от совместной фильтрации, фильтрация на основе контента не требует данных от других пользователей для создания рекомендаций. После того, как пользователь выполнил поиск и просмотр нескольких элементов и/или совершил некоторые покупки, система фильтрации на основе контента может начать давать соответствующие рекомендации. Это делает его идеальным для предприятий, у которых нет огромного пула пользователей для выборки. Это также хорошо работает для продавцов, у которых много пользователей, но мало взаимодействий с ними в определенных категориях или нишах.
  • Рекомендации очень важны для пользователя. Рекомендации на основе контента могут быть точно адаптированы к интересам пользователя, включая рекомендации для нишевых элементов, поскольку метод основан на сопоставлении характеристик или атрибутов объекта базы данных с профилем пользователя. Например, фильтрация на основе контента распознает предпочтения и вкусы конкретного пользователя, такие как острые соусы, сделанные в Техасе с органическим перцем шотландского происхождения, и рекомендует продукты с такими же характеристиками. Контентная фильтрация также полезна для предприятий с обширными библиотеками, содержащими один тип продуктов, таких как смартфоны, где рекомендации должны основываться на множестве отдельных функций.
  • Рекомендации прозрачны для пользователя. Высоко релевантные рекомендации создают ощущение открытости для пользователя, повышая уровень его доверия к предлагаемым рекомендациям. Для сравнения, при совместной фильтрации чаще возникают случаи, когда пользователи не понимают, почему они видят конкретные рекомендации. Например, предположим, что группа пользователей, купивших зонт, также купила пуховики. Совместная система может рекомендовать пуховики другим пользователям, которые купили зонты, но не заинтересованы в них и никогда не просматривали и не покупали этот продукт.
  • Вы избегаете проблемы «холодного запуска». Совместная фильтрация создает потенциальный сценарий холодного старта, когда на новом веб-сайте или в сообществе мало новых пользователей и не хватает пользовательских подключений. Хотя фильтрация на основе контента требует некоторых первоначальных входных данных от пользователей, чтобы начать давать рекомендации, качество ранних рекомендаций, как правило, лучше, чем система совместной работы, которая требует добавления и сопоставления миллионов точек данных перед оптимизацией.
  • Системы фильтрации на основе контента обычно легче создавать. Наука о данных, стоящая за системой фильтрации на основе контента, относительно проста по сравнению с системами совместной фильтрации, предназначенными для имитации рекомендаций от пользователя к пользователю. Настоящая работа в контентной фильтрации заключается в назначении атрибутов.

Проблемы контентной фильтрации

Как и все рекомендательные системы, контентная фильтрация имеет как плюсы, так и минусы. Мы рассмотрели некоторые преимущества. Вот несколько недостатков.

  • Не хватает новизны и разнообразия. Рекомендации — это больше, чем актуальность. Предположим, вам понравился фильм Тенет. Скорее всего, вам тоже понравится Inside Man. Но есть большая вероятность, что вам не нужна рекомендательная система, чтобы сказать вам об этом. Таким образом, чтобы быть полезными, рекомендательные механизмы должны давать разнообразные и неожиданные результаты.
  • Масштабируемость — это вызов. Каждый раз, когда добавляется новый продукт, услуга или новый контент, его атрибуты должны быть определены и помечены. Трудоемкий, бесконечный характер назначения атрибутов может затруднить масштабирование и потребовать много времени.
  • Атрибуты могут быть неправильными или несовместимыми. Рекомендации, основанные на содержании, так же хороши, как и эксперты в предметной области, помечающие элементы. Потенциально миллионы элементов могут нуждаться в присвоении атрибутов, а поскольку атрибуты могут быть субъективными, многие из них могут быть неправильно помечены. Процесс, обеспечивающий последовательное и точное применение атрибутов, имеет первостепенное значение. В противном случае рекомендательная система на основе контента не будет работать должным образом.

Заключение

Рекомендательные системы, такие как фильтрация на основе контента, приносят пользу как продавцам, так и покупателям. Покупатели могут тратить меньше времени на поиск страниц различных продуктов на цифровой торговой площадке. Продавцы могут лучше понять предпочтения клиентов, обеспечить более персонализированный подход к покупателю, увеличить продажи и повысить лояльность к бренду, используя фильтрацию на основе контента.