Простое введение в понимание авторегрессионной интегрированной скользящей средней

Если вы входите в число 50% американцев, владеющих акциями, я уверен, что вы провели несколько бессонных ночей, думая о будущей цене своих инвестиций. Вы можете попытаться успокоить свои страхи, читая прогнозы экономистов и других специалистов по инвестициям, но как они составляют свои прогнозы? Одним из способов является использование моделей авторегрессионного интегрированного скользящего среднего (ARIMA).

Что такое авторегрессионная интегрированная скользящая средняя?

Модели авторегрессионного интегрированного скользящего среднего (ARIMA) широко используются во многих отраслях. Он широко используется в прогнозировании спроса, например, при определении будущего спроса в производстве продуктов питания. Это связано с тем, что модель предоставляет менеджерам надежные рекомендации по принятию решений, связанных с цепочками поставок. Модели ARIMA также можно использовать для прогнозирования будущей цены ваших акций на основе прошлых цен. Обратите внимание: хотя они могут помочь вам предсказать изменения цены индекса S&P 500 с течением времени, мне очень жаль, но это не поможет вам заработать быстрые деньги, предсказывая, когда вирусные акции, такие как Gamestop (GME), взлетят вверх. в следующий раз".

Это потому, что модели ARIMA представляют собой общий класс моделей, используемых для прогнозирования данных временных рядов. Модели ARIMA обычно обозначаются как ARIMA (p, d, q), где p — порядок авторегрессионной модели, d — степень различия, а q — порядок модели скользящего среднего. Модели ARIMA используют разность для преобразования нестационарного временного ряда в стационарный, а затем прогнозируют будущие значения на основе исторических данных. Эти модели используют автоматические корреляции и скользящие средние по остаточным ошибкам в данных для прогнозирования будущих значений.

Потенциальные плюсы использования моделей ARIMA

  • Для обобщения прогноза требуются только априорные данные временного ряда.
  • Хорошо работает на краткосрочных прогнозах.
  • Моделирует нестационарные временные ряды.

Потенциальные минусы использования моделей ARIMA

  • Трудно предсказать поворотные моменты.
  • В определении (p, d, q) порядка модели присутствует довольно много субъективности.
  • Вычислительно дорого.
  • Более низкая производительность для долгосрочных прогнозов.
  • Нельзя использовать для сезонных временных рядов.
  • Менее объяснимо, чем экспоненциальное сглаживание.

Как построить модель ARIMA

Допустим, вы хотите предсказать цену акций компании с помощью модели ARIMA. Во-первых, вам нужно будет загрузить общедоступную цену акций компании за последние несколько — скажем, десять — лет. Получив эти данные, вы готовы к обучению модели ARIMA. Основываясь на тенденциях в данных, вы выберете порядок разности (d), необходимый для этой модели. Далее на основе автокорреляций и частичных автокорреляций можно определить порядок регрессии (p) и порядок скользящего среднего (q). Адекватная модель может быть выбрана с использованием Информационного критерия Акаике (AIC), Байесовского информационного критерия (BIC), максимальной вероятности и стандартной ошибки в качестве показателей производительности.

Понимание того, как работает модель ARIMA

Как указывалось ранее, ARIMA(p,d,q) — одна из самых популярных эконометрических моделей, используемых для прогнозирования данных временных рядов, таких как цены акций, прогнозирование спроса и даже распространение инфекционных заболеваний. Модель ARIMA — это, по сути, модель ARMA, подогнанная к разностным временным рядам d-го порядка, так что окончательный разностный временной ряд является стационарным.

Стационарный временной ряд — это ряд, статистические свойства которого, такие как среднее значение, дисперсия, автокорреляция и т. д., неизменны во времени. Стационарный ряд относительно легко предсказать — вы просто предсказываете, что его статистические свойства в будущем будут такими же, как и в прошлом!

Чтобы понять, как работает модель ARIMA, в названии есть три термина, которые вам нужно лучше понять:

Давайте посмотрим на два графика из книги Прогнозирование: принципы и практика (2-е изд.) Роба Дж. Хайндмана и Джорджа Атанасопулоса. График (а) слева — это цена акций Google за 200 дней подряд. Это нестационарный временной ряд. График (б) справа — это ежедневное изменение цены акций Google в течение 200 дней подряд. Изображение (б) является стационарным, поскольку его значение не зависит от времени наблюдения. В этом примере порядок разности будет равен единице, поскольку разностный ряд первого порядка является стационарным.

Объединение всех трех типов моделей выше дает результирующую модель ARIMA(p,d,q).

Заключение

Методология ARIMA представляет собой статистический метод анализа и построения модели прогнозирования, которая лучше всего представляет временной ряд путем моделирования корреляций в данных. Из-за чисто статистических подходов моделям ARIMA нужны только исторические данные временного ряда, чтобы обобщить прогноз и повысить точность прогноза, сохраняя при этом экономичность модели.

Несмотря на экономичность, использование моделей ARIMA имеет множество потенциальных недостатков. Наиболее важные из них связаны с субъективностью, связанной с определением параметров p и q. Хотя используются автокорреляция и частичная автокорреляция, выбор p и q зависит от навыков и опыта разработчика модели. Кроме того, по сравнению с простым экспоненциальным сглаживанием и методом Холта-Уинтерса модели ARIMA более сложны и, следовательно, имеют меньшую объяснительную способность.

Наконец, как и все методы прогнозирования, модели ARIMA не подходят для долгосрочных прогнозов и плохо предсказывают поворотные моменты, поскольку они ориентированы на прошлое. Они также могут быть дорогостоящими в вычислительном отношении.

Таким образом, модели ARIMA можно легко и точно использовать для краткосрочного прогнозирования только с данными временных рядов, но может потребоваться некоторый опыт и эксперименты, чтобы найти оптимальный набор параметров для каждого варианта использования.

Для получения дополнительных ресурсов ознакомьтесь с некоторыми проектами, использующими метод ARIMA:

Рекомендации

  1. Инвестопедия
  2. Прогнозирование: принципы и практика (2-е изд.) Роба Дж. Хайндмана и Джорджа Атанасопулоса
  3. https://libres.uncg.edu/ir/uncw/f/zhai2005-2.pdf
  4. Прогнозировать потребление скота в Танзании
  5. "Прогнозирование спроса"
  6. Применение модели ARIMA к набору данных об эпидемии COVID-2019

Неха Бора, главный юрист, Data Science

Неха имеет степень магистра прикладной математики штата Айова и двойную степень бакалавра и магистра физики Индийского института научного образования и исследований в Пуне. Она работает вместе с командами по науке о данных, бизнесу, разработке продуктов и программному обеспечению и увлечена применением принципов хорошо управляемой разработки программного обеспечения к науке о данных. В Capital One она сосредоточена на разработке модели риска, которая помогает бизнесу восстановления оптимизировать взаимодействие с клиентами.

ЗАЯВЛЕНИЕ О РАСКРЫТИИ ИНФОРМАЦИИ: © 2021 Capital One. Мнения принадлежат конкретному автору. Если в этом посте не указано иное, Capital One не связана и не поддерживается ни одной из упомянутых компаний. Все используемые или демонстрируемые товарные знаки и другая интеллектуальная собственность являются собственностью соответствующих владельцев.

Первоначально опубликовано на https://www.capitalone.com.