Введение

Предиктивная аналитика — это использование данных для прогнозирования будущих тенденций и событий. Он использует исторические данные для прогнозирования потенциальных сценариев, которые могут помочь в принятии стратегических решений.

Прогнозы могут быть на ближайшее будущее — например, предсказание неисправности какой-либо машины позже в тот же день — или на более отдаленное будущее, например прогнозирование денежных потоков вашей компании на предстоящий год.

Прогнозный анализ может проводиться вручную или с использованием алгоритмов машинного обучения (ML). В любом случае, исторические данные используются для того, чтобы делать предположения о будущем.

Методы

Возможности применения предиктивной аналитики в различных областях управления сетью поставок представлены в таблице ниже.

В рамках данного исследования мы рассмотрим эффективность использования моделей ML для прогнозирования данных, которые используются в процессе планирования запасов.

У нас есть данные о спросе за предыдущие 3 года, на их основе мы попробуем спрогнозировать будущие значения. Давайте начнем с простой модели ML прогнозирования временных рядов и посмотрим на их эффективность.

В ходе исследования я буду использовать авторегрессионную (AutoReg) и авторегрессионную интегрированную скользящую среднюю (ARIMA) модель Python.

AutoReg — авторегрессионные модели работают исходя из того, что прошлые значения влияют на текущие значения, что делает статистический метод популярным для анализа природы, экономики и других процессов, которые меняются во времени.

ARIMA — авторегрессионное интегрированное скользящее среднее, или ARIMA, представляет собой модель статистического анализа, которая использует данные временных рядов либо для лучшего понимания набора данных, либо для прогнозирования будущих тенденций.

Оценивать эффективность моделей будем с помощью метрик:

Кроме того, при работе с моделями применялась перекрестная проверка. Весь набор данных был разделен на 4 группы.

Результаты

В ходе нескольких экспериментов было установлено, что модель AutoReg лучше всего справляется с параметром — лаги = 2. Результат использования этой модели показан на картинке ниже.

Для модели ARIMA лучшими параметрами были порядок = (1, 0, 0). Результат оценки его эффективности на картинке ниже.

Таким образом, по набору параметров лучшим результатом отображения является модель ARIMA, но она еще очень далека от желаемого.

Обсуждение

В заключение, простые модели ML не дают желаемого результата. Чтобы получить желаемый результат в нашей задаче, нам нужно найти больше параметров, от которых зависит прогнозируемое значение. Когда эти зависимости будут найдены, можно будет использовать более сложные модели для прогнозирования.