Введение

Фондовый рынок зависит от многих факторов, и из-за этой зависимости прогноз фондового рынка очень сложен. Однако каждую секунду из нескольких источников генерируется множество данных, которые могут помочь в прогнозировании фондового рынка с использованием передового алгоритма машинного обучения. В этом блоге я представляю метод, который может помочь в прогнозировании фондового рынка. В этом проекте я отвечу на 3 вопроса:

  1. Как изменился фондовый рынок (закрыть столбец) с мая 2019 г. по июнь 2019 г.?
  2. Как изменился фондовый рынок (закрыть столбец) с августа 2004 г. по июнь 2018 г.?
  3. Есть ли способ спрогнозировать фондовый рынок (закрыть столбец) с мая по июль 2019 года?

Код

Соответствующие коды этого поста доступны в моем Github.

Шаг 1: Сбор данных

Во-первых, это сбор данных об акциях из разных отдельных акций, таких как GOOGLE, AAPL или WMT. Данные могут быть собраны с различными временными интервалами, такими как ежечасно, ежедневно, еженедельно и ежегодно.

В этом блоге я собрал исторический почасовой рынок от GOOGL. После сбора данных нам необходимо изучить данные, используя статистические методы и визуализацию.

Статистика может включать в себя: среднее, максимальное, минимальное, квартили, режим, тип данных (строка, целое число, число с плавающей запятой и…)

Исследовательская визуализация может включать в себя: гистограмму, гистограмму, круговую диаграмму, график тренда и т. д.

Для получения дополнительной информации о проведенных исследовательских шагах, пожалуйста, взгляните на доступные коды в моем Github.

Собранные данные распределяются по 4 столбцам следующим образом: открытое, высокое, низкое, близкое.

Ответ на вопрос 1:

Ответ на вопрос 2:

Шаг 2: Разработка модели

Имейте в виду, что не все алгоритмы и этапы машинного обучения подходят для прогнозирования фондового рынка. Например, мы знаем, что данные фондового рынка зависят от времени, поэтому метод перетасовки (который широко используется в алгоритмах машинного обучения) неприменим для фондового рынка.

Существуют различные алгоритмы, которые можно использовать для прогнозирования фондового рынка, такие как рекурсивная стратегия, прямая стратегия, стратегия DirRec и стратегии с несколькими выходами. Подробная информация об этих моделях описана в статье «Стратегии машинного обучения для прогнозирования временных рядов» (Джанлука Бонтемпи и др., 2013).

В этой работе я реализовал только рекурсивную стратегию.

Шаг 3: Использование модели

Я применил построенную модель для прогнозирования фондового рынка. В этой модели каждые 60 точек данных используются для прогнозирования следующего значения. Результаты отображаются с помощью matplotlib.

Ответ на вопрос 3:

Вывод:

Прогнозируемые результаты (оранжевый цвет на рис. 3) показывают, что фондовый рынок должен снижаться с июня 2019 г. по август 2019 г., что противоречит реальным данным фондового рынка. Можно сделать вывод, что фондовый рынок очень сложно предсказать. Вероятно, более продвинутый метод мог бы помочь предсказать будущее фондового рынка. Кстати, должны быть и другие факторы, которые могут повлиять на фондовый рынок. Например, выборы в большой стране, такой как США, или революция в стране обязательно должны быть приняты во внимание, чтобы предсказать фондовый рынок.

Что вы думаете? Можно ли предсказать фондовый рынок и стать миллиардером, используя науку о данных? :)