Для прогнозирования на основе исторических данных модели линейной регрессии широко используются в анализе данных и прогнозном моделировании. Набор входных переменных, также известный как функции, используется для установления связи между целевой переменной и входными переменными. На основе новых входных данных модели линейной регрессии могут генерировать прогнозы для целевой переменной.

Цель этой статьи — сравнить фактические и прогнозируемые значения в модели линейной регрессии. Изучая, как эти значения согласуются, мы оцениваем способность модели фиксировать основные закономерности и тенденции. Степень согласия между фактическими и прогнозируемыми значениями дает представление о точности и надежности модели.

Библиотека pandas в Python предоставляет мощные инструменты для обработки и анализа данных. Используя pandas, мы создадим DataFrame, который включает в себя как фактические значения, так и прогнозы линейной регрессии. Мы можем выявить закономерности, несоответствия и тенденции, визуализируя эти данные.

Сравнивая прогнозы модели линейной регрессии с фактическими значениями, эта статья дает практическое и интуитивное понимание того, как оценивать модель линейной регрессии. Следуя предоставленным примерам кода и пояснениям, читатели смогут выполнить это сравнение и получить важные сведения из своих собственных регрессионных моделей.

Обзор набора данных. В наборе данных около 60 функций, охватывающих множество тем. Функции получены из данных OHLC (открытие, максимум, минимум, закрытие), а также цен других индексов, таких как QQQ (NASDAQ-100 ETF) и S&P 500. Кроме того, набор данных включает технические индикаторы, такие как полосы Боллинджера, экспоненциальные скользящие средние. (EMA), стохастический осциллятор %K и RSI (индекс относительной силы).

Кроме того, на основе данных о ценах за предыдущий день были сгенерированы запаздывающие функции, поскольку предыдущие цены влияют на будущие цены.

Также включены функции, связанные с датой, например, соответствует ли она високосному году, началу или концу месяца, началу или концу квартала и т. д.

В целях прогнозирования каждая из этих функций дает ценную информацию. Есть функции, которые выявляют тренды, другие, которые дают сигналы относительно условий перекупленности или перепроданности, и третьи, которые указывают на силу ценового тренда.