Прогнозируйте ежедневное потребление электроэнергии с помощью нейронных сетей.

Как простая трехмерная структура снижает количество ошибок, превосходит более сложные модели и удваивает экономию.

В начале 2019 года мы построили модель глубокого обучения, которая предсказывала потребление электроэнергии на почасовой основе. Поскольку малейшая ошибка может стоить электроэнергетической компании десятки тысяч долларов, мы исследовали ряд более сложных прогнозистов. В конце концов, мы обнаружили, что простой дневной подход является наиболее эффективным, часто сокращая ошибку вдвое.

СТРУКТУРА

В нашей предыдущей модели мы вводили все функции, которые, по нашему мнению, имели отношение к нагрузке на данный час: дату, данные о погоде и т. Д. Затем нейронная сеть выводила прогноз нагрузки на этот час. Это было повторено 72 раза, чтобы дать прогноз на 3 дня. Для более подробного объяснения, подумайте о прочтении оригинального сообщения в блоге.

Новая структура эффективно сочетает в себе 24-часовые модели. Но вместо расчета одного часа мы объединяем все веса в один плоский, полностью связанный плотный слой (мы остановились примерно на 900 узлах). Затем этот слой полностью связан с 24-часовым вектором. Затем мы повторяем это в течение 3 дней, чтобы получить 72-часовой прогноз.

Почему это должно работать?

Главный вывод должен заключаться в том, что разные часы «информируют» друг друга. В нашей старой модели у нас был очень прямой метод: с учетом всех этих факторов, каков прогноз на этот час? Но в нашей новой модели все факторы, влияющие на прогноз нагрузки на 16:00, могут влиять на прогноз нагрузки на 17:00. Если в 6 утра 30 ° F, разве это не повлияет на работу обогревателей к 9 утра? Нейронная сеть может идентифицировать эти сложные корреляции и предоставлять более обоснованный прогноз.

Как это построено?

Правильная подготовка трехмерных обучающих данных может быть сложной задачей. Вот не совсем элегантная функция для соответствующей группировки данных по нужным размерам.

Затем он подается в следующую сеть:

Почему не RNN?

Рекуррентная нейронная сеть, или RNN, будет работать аналогично сети, описанной выше. Но наше тестирование с LSTM и GRU (двумя популярными моделями RNN) не увенчалось успехом. Мы не могли производить модели, которые превосходили нашу простейшую почасовую структуру. Короче говоря, традиционная структура RNN, казалось, только усугубила ситуацию.

Почему круглосуточно?

В нашем краткосрочном прогнозном анализе мы часто заботимся о нагрузке с трехдневным шагом (дальнейшие прогнозы быстро становятся бесполезными). Так почему бы не тренироваться по 72-часовому вектору? Технически мы можем, но затраты не перевешивают выгоды. Согласно нашему 24-часовому прогнозу, дневная модель работает в три раза медленнее, чем почасовая, но отдача (как мы увидим ниже) очень высока. Но по мере того, как мы увеличиваем прогноз до 48 или 72 часов, модель сильно замедляется с небольшими улучшениями. По крайней мере, для наших целей лучше обучать отдельно трех 24-часовых моделей.

РЕЗУЛЬТАТЫ, ДОСТИЖЕНИЯ

Мы протестировали новую модель в районе Северо-Центральный Техаса. Данные можно найти здесь. Хотя на самом деле модель будет тренироваться ежедневно, в этом тесте мы строго тренировались на данных за первые 16 лет (2002–2017) и тестировали в последний год (2018). Чтобы смоделировать неопределенность прогнозов погоды, мы добавили шум к историческим данным о погоде - нормальные распределения со стандартными отклонениями 2,5, 4 и 6 градусов для 24, 48 и 72 часов соответственно.

Точность

Новая модель имеет среднюю абсолютную процентную ошибку (MAPE) 3, в то время как старая модель имеет MAPE 4 в течение первых 24 часов. Но почасовые результаты гораздо более убедительны.

Наиболее существенной проблемой является не только MAPE, но и разброс ошибок (представленный ниже как межквартильный диапазон, или IQR). При разработке нашей первой модели мы обнаружили, что когда наша модель была неправильной, она часто была * очень * неправильной. Уменьшение дисперсии в новой модели может помочь нам более уверенно сообщать энергокомпаниям о нашей неопределенности.

Захваченная экономия

А главное - сэкономленные деньги! Снижение ошибки на 1 процентный пункт может показаться незначительным, но в 2018 году это удвоило бы пиковую экономию средств на бритье в Техасе. (Если вы не знакомы с пиковым бритьем, попробуйте это объяснение).

Предполагая, что батареи с зарядом 700 кВт и номинальной мощностью 500 кВт, мы можем рассчитать, сколько пикового сбоя может произойти с точным прогнозом. Вы можете зафиксировать 36 процентов оптимального значения с помощью нашей почасовой модели нейронной сети. И, заменив новую модель (не включая причудливую оптимизацию под анализ неопределенности), мы можем получить 64 процента, что почти удвоит нашу экономию!

Предложения приветствуются

Нам не удалось разработать надлежащую RNN, которая бы превосходила нашу модель, но это не означает, что ее не существует. Малейшее повышение точности может существенно помочь электроэнергетическим компаниям, поэтому, если вы думаете, что есть структура, которую мы не рассматривали, не стесняйтесь обращаться к нам!

Есть вопросы? Исправления? Шутки о данных о данных? Свяжитесь со мной или посмотрите другие проекты на моем сайте.

Исследования в сотрудничестве с Open Modeling Framework.

Это обновление серии из трех частей о снижении пиков с помощью нейронных сетей. Прочтите подробнее здесь: