Руководство по созданию системы рекомендаций с использованием контентной фильтрации в Python.

Привет друзья, на этот раз я построю системную рекомендацию с помощью метода Content-Based Filtering. Контентная фильтрация работает с данными, предоставленными пользователями, явно (ранжирование) или неявно (нажатие ссылок). На основе этих данных создается профиль пользователя, который затем используется для предоставления пользователю предложений. По мере того, как пользователи оставляют больше отзывов или предпринимают действия на основе рекомендаций, движок становится все более и более точным. В моем предыдущем посте я также обсуждал определение рекомендательной системы и методы, которые можно применять, и вы можете проверить это здесь.

Набор данных

На этот раз при разработке системы рекомендаций я буду использовать набор данных Indonesia Tourism Destination. Этот набор данных — набор данных, который я собрал сам, вы можете увидеть его на Kaggle.

Как обычно, импортируйте некоторые библиотеки, необходимые для обработки набора данных.

Создайте команду кода для вызова базы данных с помощью: pd.read_csv(“tourism_with_id.csv”) и просмотра набора данных с помощью .head().

Исследовательский анализ данных

На этом этапе выполните простой анализ, такой как форма, описание (), информация (), а также визуализация, чтобы получить представление о наборе данных.

Описание туристических направлений

Описания туристических направлений полезны для понимания информационного содержания каждого туристического места в фрейме данных, который мы вводим. Описания туристических достопримечательностей сделаны путем создания функции.

Предварительная обработка текста

После анализа и описания туристических достопримечательностей следующим процессом является предварительная обработка текста, которая направлена ​​на то, чтобы данные, используемые позже, можно было позже преобразовать в числа с помощью TF-IDF и косинусного сходства. Данные, которые будут использоваться, — это только столбец «описание», чтобы позже получить сходство в приложении.

Построить модель

На этапе моделирования я создал функцию рекомендации одних и тех же туристических достопримечательностей по результатам выполненного TF-IDF и косинусного подобия. Результаты будут отображаться в виде 5 ближайших к названию туристических достопримечательностей, которые мы определяем.

Предсказать модель:

Заключение

Использование системы рекомендаций с использованием метода фильтрации на основе содержимого может дать названия туристических достопримечательностей, которые имеют сходство с точки зрения описаний, отображаемых в наборе данных.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.