В этом уроке мы обсудим случай со структурированными данными, если добавление данных может снизить производительность.

Мы начнем наше обсуждение с примера рекомендательной системы, в которой у нас есть данные о людях и ресторане. Мы создали нейронную сеть, чтобы рекомендовать пользователям ресторан в зависимости от спроса, как показано на рис. 1. Возможно, мы упустили случай, когда вегетарианцам рекомендуются мясные рестораны.

ДЕЛО — НЕДОСТАЮЩАЯ ИНФОРМАЦИЯ

Предположим, есть сценарий, в котором человек является вегетарианцем, а ресторан по-прежнему рекомендует, чтобы ресторан этого человека содержал мясо. В этом случае мы не можем распознать, что добавить в данные «Информация о человеке» или «Информация о ресторане».

В этом конкретном сценарии лучше добавить функцию (новый столбец) в структурированные данные, которые будут добавлены в набор данных. значение столбца может быть бинарным или процент заказов клиентов содержит овощи. Резюме показано на рисунке ниже. Другой случай — добавить информацию о ресторане, содержащую вегетарианскую информацию.

Фиксированный набор клиентов и продуктов затрудняет увеличение данных в этом случае.

Дополнительные возможности

Может быть и другой случай, когда пользователи заказывают только чай или кофе. В этом случае нам нужно добавить больше функций для его отслеживания. Рис. 3 показывает более подробную информацию. В современном мире системы товарных рекомендаций перешли от совместной фильтрации к фильтрации на основе контента.

Совместная фильтрация рекомендует на основе похожих пользователей с одинаковым выбором или процентным соотношением одинаковых вариантов. В то время как рекомендации на основе контента основаны на описаниях ресторанов и их пользователей, он также может рекомендовать, если представлен новый продукт, и ни один пользователь не выбрал этот продукт. Преимущество фильтрации на основе контента заключается в том, что даже если есть новый ресторан

или новый продукт, который вряд ли кому-то еще понравился, взглянув на описание ресторана, а не просто глядя на то, кому еще нравятся рестораны, вы можете быстрее дать хорошие рекомендации. Иногда это также называется холодным стартом. Проблема.