Временные ряды — это хронологически упорядоченные последовательности данных. В нем есть четыре компонента: уровень, тренд, сезонность и шум. Уровень представляет собой среднее значение в ряду, а тренд показывает направление, в котором он движется (восходящий, нисходящий или постоянный). Любые закономерности, возникающие в определенные сезоны или периоды, можно отнести к сезонности. В окончательном определении шум относится к случайным факторам, таким как изменчивость выборки или внешние воздействия, такие как политика, стихийные бедствия или забастовки.

Учитывая, что временной ряд может быть стационарным, то есть в нем нет тренда или сезонности, компоненты тренда и сезонности являются необязательными.

Стационарность против стационарности: стационарный временной ряд имеет постоянную тенденцию и компонент сезонности. Сезонность, с другой стороны, относится к периодическим колебаниям ряда. Чтобы избежать вводящих в заблуждение отношений, тренд и стационарность должны быть удалены из временного ряда. В результате любые наблюдаемые закономерности или корреляции обусловлены не только этими компонентами.

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import matplotlib.pyplot as plt # Plotting

# Read data and make Date column index
djia = pd.read_csv("../input/DJIA_table.csv", parse_dates=['Date'], index_col='Date')
print(djia.head())

Фрагмент кода написан на Python и использует несколько библиотек. Во-первых, он импортирует необходимые библиотеки для обработки и визуализации данных: numpy, pandas и matplotlib.pyplot. Библиотеки предоставляют функции и инструменты для математических операций, манипулирования массивами, обработки данных и ввода и вывода файлов CSV.

Затем код считывает CSV-файл с именем «DJIA_table.csv». «../input/DJIA_table.csv» — это путь к файлу. Функция pd.read_csv из библиотеки pandas используется для чтения файла CSV в кадр данных pandas. «Дата» анализируется как дата, а «index_col=«Дата» устанавливает столбец «Дата» в качестве столбца индекса DataFrame.

Результирующий DataFrame с именем `djia` содержит данные, извлеченные из CSV-файла. Строки и столбцы представляют наблюдения и переменные соответственно в табличном формате. Столбец «Дата» служит индексом…