ОБЗОР ПРОЕКТА
В этом посте я проведу вас через создание некоторого регрессора из библиотеки scikit-learn, а затем мы выделим наилучшую точность.
ПОСТАНОВКА ЗАДАЧИ
Один из ведущих розничных магазинов в США, Walmart, хотел бы точно прогнозировать продажи и спрос. Есть определенные события и праздники, которые влияют на продажи каждый день. Доступны данные о продажах 45 магазинов Walmart. Бизнес сталкивается с проблемой из-за непредвиденных потребностей и иногда заканчивается на складе из-за неподходящего алгоритма машинного обучения. Идеальный алгоритм машинного обучения будет точно прогнозировать спрос и учитывать такие факторы, как экономические условия, включая индекс потребительских цен, индекс безработицы и т. д.
ПОКАЗАТЕЛИ
Я использовал cross_val_score из библиотеки sklearn.model_selection, чтобы проверить точность моделей.
ИЗУЧЕНИЕ ДАННЫХ
Это исторические данные о продажах с 05.02.2010 по 01.11.2012 в файле Walmart_Store_sales. В этом файле вы найдете следующие поля:
- Магазин — номер магазина
- Дата — неделя продаж
- Weekly_Sales — продажи для данного магазина
- Holiday_Flag — является ли неделя особым праздником. week 1 — Праздничная неделя 0 — Непраздничная неделя
- Температура — Температура в день продажи
- Fuel_Price — Стоимость топлива в регионе
- CPI — Преобладающий индекс потребительских цен
- Безработица — Преобладающий уровень безработицы
Праздничные события
Суперкубок: 12 февраля 2010 г., 11 февраля 2011 г., 10 февраля 2012 г., 8 февраля 2013 г.
День труда: 10-сен-10, 9-сен-11, 7-сен-12, 6-сен-13
День Благодарения: 26 ноября 2010 г., 25 ноября 2011 г., 23 ноября 2012 г., 29 ноября 2013 г.
Рождество: 31 декабря 2010 г., 30 декабря 2011 г., 28 декабря 2012 г., 27 декабря 2013 г.
В этом посте мы постараемся ответить на следующие важные вопросы:
1. Влияет ли изменение магазина на продажи?
2. Влияет ли изменение типа магазина на продажи?
3- Влияет ли изменение размера магазина на продажи?
4- Осуществляются ли продажи в праздничные дни?
Наконец, спрогнозируйте еженедельные продажи для каждого магазина/отделения.
ВИЗУАЛИЗАЦИЯ
1- Влияет ли изменение магазина на продажи?
Как наблюдение, средние значения очень разные, что заставляет меня думать, что некоторые магазины / отделы могут продавать такие больше, чем другие.
2- Влияет ли изменение типа магазина на продажи?
В качестве наблюдения могу сказать, что недельное изменение продаж зависит от размера магазина.
3- Влияет ли изменение размера Магазина на продажи?
В качестве наблюдения могу сказать, что у каждого есть прямая зависимость между размером магазина и недельными продажами.
4- Осуществляются ли продажи в праздничные дни?
Как и выше, мы можем сказать, что еженедельные продажи увеличиваются в праздничные дни.
ЭТАПЫ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ДАННЫХ
Отсутствующие значения и работа с категориальными переменными привели к некоторым сложностям при подборе моделей машинного обучения с помощью sklearn.
Итак, прежде всего, мы проверим отсутствующие значения и типы данных переменных.
РЕАЛИЗАЦИЯ
Я создаю несколько моделей (LinearRegression, DecisionTreeRegressor, RandomForestRegressor и KNeighborsRegressor) с помощью библиотеки sklearn.
РЕЗУЛЬТАТЫ
Лучшая точность, которую я получил: RandomForestRegressor, который имеет показатель точности обучения 97,0%.
ОБОСНОВАНИЕ
В конце я могу спрогнозировать еженедельные продажи для 99 отделов в 45 магазинах Walmart, расположенных в разных регионах.
ГИТХАБ-КОД
Чтобы получить код для этого поста, пожалуйста, нажмите здесь.
ТАБЛИЦА ИНФОРМАЦИОННАЯ ПАНЕЛЬ
Для доступа к приборной панели нажмите нажмите здесь.
БУДУЩИЕ УЛУЧШЕНИЯ
Это была сессия простого исследования данных, построения графиков и построения регрессора.
Я хочу сделать больше в ближайшем будущем.
Если будут обнаружены какие-либо ошибки, пожалуйста, напишите мне по адресу [email protected]. »