Создайте комплексный проект по науке о данных с помощью последнего плагина ChatGPT.

Как человек, который в настоящее время совмещает работу по анализу данных с несколькими внештатными проектами, я обычно первым пробую инструменты, которые потенциально могут сократить время выполнения работ.

Когда на прошлой неделе ChatGPT начал развертывание плагина Code Interpreter для подписчиков, мне не терпелось включить его в свои проекты по науке о данных.

Если вы еще не слышали об этом инструменте, Code Interpreter — это плагин, который позволяет загружать документы и запускать программы Python внутри интерфейса ChatGPT.

Прошли те времена, когда мы вручную копировали и вставляли данные в ChatGPT и ждали ответа.

С помощью Code Interpreter вы можете просто загрузить свой набор данных и получить инструмент для анализа ваших данных, построения моделей машинного обучения и создания визуализаций за считанные минуты.

В этой статье я покажу вам, как можно использовать интерпретатор кода для выполнения сквозного проекта по науке о данных.

Задача — Сегментация клиентов

В моей предыдущей компании я работал специалистом по маркетинговым данным.

Это означало, что я буду использовать данные о клиентах для увеличения продаж — определяя наших самых прибыльных пользователей, прогнозируя уровень оттока и создавая профили людей, на которых следует ориентироваться в будущих маркетинговых кампаниях.

Я даже написал учебник по построению модели сегментации клиентов с помощью Python, в котором я использовал общедоступный набор данных, чтобы определить, насколько ценен каждый клиент для компании электронной коммерции.

В этой статье мы будем выполнять сегментацию клиентов на одном и том же наборе данных. Однако на этот раз мы будем использовать интерпретатор кода ChatGPT, который поможет нам построить модель.

Предварительные условия

Для этого анализа мы будем использовать набор данных электронной коммерции Kaggle. Этот набор данных был получен из Репозитория машинного обучения UCI и содержит информацию о реальных розничных транзакциях для британской компании электронной коммерции.

Этот набор данных находится под лицензией Creative Commons Attribution 4.0 International (CC BY 4.0).