ОБЗОР ПРОЕКТА

В этом посте я проведу вас через создание некоторого регрессора из библиотеки scikit-learn, а затем мы выделим наилучшую точность.

ПОСТАНОВКА ЗАДАЧИ

Один из ведущих розничных магазинов в США, Walmart, хотел бы точно прогнозировать продажи и спрос. Есть определенные события и праздники, которые влияют на продажи каждый день. Доступны данные о продажах 45 магазинов Walmart. Бизнес сталкивается с проблемой из-за непредвиденных потребностей и иногда заканчивается на складе из-за неподходящего алгоритма машинного обучения. Идеальный алгоритм машинного обучения будет точно прогнозировать спрос и учитывать такие факторы, как экономические условия, включая индекс потребительских цен, индекс безработицы и т. д.

ПОКАЗАТЕЛИ

Я использовал cross_val_score из библиотеки sklearn.model_selection, чтобы проверить точность моделей.

ИЗУЧЕНИЕ ДАННЫХ

Это исторические данные о продажах с 05.02.2010 по 01.11.2012 в файле Walmart_Store_sales. В этом файле вы найдете следующие поля:

  • Магазин — номер магазина
  • Дата — неделя продаж
  • Weekly_Sales — продажи для данного магазина
  • Holiday_Flag — является ли неделя особым праздником. week 1 — Праздничная неделя 0 — Непраздничная неделя
  • Температура — Температура в день продажи
  • Fuel_Price — Стоимость топлива в регионе
  • CPI — Преобладающий индекс потребительских цен
  • Безработица — Преобладающий уровень безработицы

Праздничные события

Суперкубок: 12 февраля 2010 г., 11 февраля 2011 г., 10 февраля 2012 г., 8 февраля 2013 г.

День труда: 10-сен-10, 9-сен-11, 7-сен-12, 6-сен-13

День Благодарения: 26 ноября 2010 г., 25 ноября 2011 г., 23 ноября 2012 г., 29 ноября 2013 г.

Рождество: 31 декабря 2010 г., 30 декабря 2011 г., 28 декабря 2012 г., 27 декабря 2013 г.

Загрузить набор данных здесь

В этом посте мы постараемся ответить на следующие важные вопросы:
1. Влияет ли изменение магазина на продажи?
2. Влияет ли изменение типа магазина на продажи?
3- Влияет ли изменение размера магазина на продажи?
4- Осуществляются ли продажи в праздничные дни?

Наконец, спрогнозируйте еженедельные продажи для каждого магазина/отделения.

ВИЗУАЛИЗАЦИЯ

1- Влияет ли изменение магазина на продажи?

Как наблюдение, средние значения очень разные, что заставляет меня думать, что некоторые магазины / отделы могут продавать такие больше, чем другие.

2- Влияет ли изменение типа магазина на продажи?

В качестве наблюдения могу сказать, что недельное изменение продаж зависит от размера магазина.

3- Влияет ли изменение размера Магазина на продажи?

В качестве наблюдения могу сказать, что у каждого есть прямая зависимость между размером магазина и недельными продажами.

4- Осуществляются ли продажи в праздничные дни?

Как и выше, мы можем сказать, что еженедельные продажи увеличиваются в праздничные дни.

ЭТАПЫ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ДАННЫХ

Отсутствующие значения и работа с категориальными переменными привели к некоторым сложностям при подборе моделей машинного обучения с помощью sklearn.

Итак, прежде всего, мы проверим отсутствующие значения и типы данных переменных.

РЕАЛИЗАЦИЯ

Я создаю несколько моделей (LinearRegression, DecisionTreeRegressor, RandomForestRegressor и KNeighborsRegressor) с помощью библиотеки sklearn.

РЕЗУЛЬТАТЫ

Лучшая точность, которую я получил: RandomForestRegressor, который имеет показатель точности обучения 97,0%.

ОБОСНОВАНИЕ

В конце я могу спрогнозировать еженедельные продажи для 99 отделов в 45 магазинах Walmart, расположенных в разных регионах.

ГИТХАБ-КОД

Чтобы получить код для этого поста, пожалуйста, нажмите здесь.

ТАБЛИЦА ИНФОРМАЦИОННАЯ ПАНЕЛЬ

Для доступа к приборной панели нажмите нажмите здесь.

БУДУЩИЕ УЛУЧШЕНИЯ

Это была сессия простого исследования данных, построения графиков и построения регрессора.
Я хочу сделать больше в ближайшем будущем.
Если будут обнаружены какие-либо ошибки, пожалуйста, напишите мне по адресу [email protected]. »