Изменение климата - это проблема, которая становится все более важной, и все больше и больше событий, связанных с этим явлением, затрагивают различные международные сферы. Мы видим, что климат вызывает озабоченность у всех, и финансовый мир не является исключением.

Благодаря технологическим инновациям и различным инструментам, таким как машинное обучение и другие методы прогнозирования, у нас есть возможность улучшить ситуацию.

Эта статья призвана представить различные возможности / перспективы машинного обучения в отношении проблемы климата в финансах.

Но прежде чем говорить обо всем этом, давайте введем несколько важных терминов.

Финансовый риск — это непредсказуемость потенциальных финансовых потерь, которые могут возникнуть в результате инвестиционного решения.

Прежде всего, важно знать, что существует несколько видов финансовых рисков: рыночный риск, процентный риск, кредитный риск и др.

В этой статье мы сосредоточимся на риске, связанном с изменением климата, который относится к набору потенциальных рисков, которые могут возникнуть в результате изменения климата и которые могут повлиять на безопасность и надежность отдельных финансовых учреждений и иметь более широкие последствия для финансовой стабильности банковской системы. системы (например: потенциальные экономические затраты и финансовые потери в результате увеличения серьезности и частоты экстремальных явлений, связанных с изменением климата)

Наша цель — предвидеть эти изменения и создать модель, точно отражающую этот риск.

Вопрос в том, как мы это делаем?

Через эти 3 шага мы можем сделать этот анализ.

1. Определение правильного процесса машинного обучения

Как и в любом процессе машинного обучения, важно выбрать, что вы хотите предсказать и что вы используете в качестве предиктора.

В нашем случае предикторами являются климатические индексы. Однако определение цели прогноза немного сложнее.

Давайте возьмем пример с денежным потоком, чтобы лучше понять его.
Денежный поток просто определяется как все деньги, поступающие и уходящие из казначейства. Денежный поток позволяет определить здоровье компании. На денежный поток влияет определенный финансовый риск, который может привести к убыткам (например, неплатежи клиента, изменение рынка, влияющее на ваш бизнес, технический сбой и т. д.). Вычисление риска здесь соответствует оценке эволюции денежного потока (например, если в будущем будет поступать или уходить гораздо больше денег), и для этого мы используем рыночные данные.

Вот почему нашей прогнозируемой целью будут рыночные данные, данные, которые будут использоваться для расчета убытков.

2. Построение модели

Теперь, когда мы это определили, пришло время построить модель. Это можно сделать в 3 шага.

Шаг 1. Сбор данных

Необходимо было получить климатические и финансовые данные, необходимые для построения моделей. Это долгий процесс поиска в Интернете данных из открытых источников для обучения модели. Одним из основных источников, который мы будем использовать, является сайт ОЭСР. Он содержит информацию по самым разным темам, в том числе интересующим нас, таким как финансы, экономика и окружающая среда.

Другими используемыми сайтами являются Kaggle и Открытая платформа для французских общедоступных данных. Извлекаемые данные представляют собой рыночные кривые (например, изменение процентных ставок, кредитов и т. д.), а также климатические данные, такие как выбросы парниковых газов в каждой стране, осадки и т. д. Эти данные в основном извлекаются в формате xml или csv.

После сбора важно очистить данные (заполнить пустые случаи, удалить ненужные значения, стандартизировать значения), другими словами, улучшить качество данных.

Шаг 2. Анализ данных

Теперь перейдем к анализу данных. Цель этой части — работать с данными, чтобы получить как можно больше полезной информации для разработки моделей. Поэтому речь идет об использовании имеющихся в нашем распоряжении статистических инструментов, чтобы попытаться определить тенденцию в данных и использовать их для оптимизации моделей. Большую часть работы можно выполнить с помощью графиков.

Шаг 3. Создание модели

Тенденции, обнаруженные в данных, должны дать нам представление о подходящей модели для использования. Есть много возможных моделей. Важно начать с самых простых моделей (например, линейной регрессии), прежде чем приступать к нейронным сетям.

Здесь мы сравниваем точность различных протестированных моделей

Параметры, используемые для модели:
- Прогностическим фактором является выброс CO2 во Франции (обычно индикатор перехода к климату).
 – Целью является долгосрочная процентная ставка (это хороший показатель состояния экономики внутри страны).
 – Используемые модели: Байесовский хребет (BR), Лассо Ларс (LL), ARDRegression (ARD), пассивно-агрессивный регрессор (PAR), TheilSenRegressor (TS),
линейная регрессия (LR) и ElasticNet (EN). Это простая и «классическая» модель регрессии.

Как мы видим, точность не так хороша. Чтобы попытаться получить лучшие результаты, мы можем попытаться увидеть, имеют ли нейронные сети лучшую производительность. К сожалению, объем доступных данных недостаточен для создания хорошей нейронной сети. Чтобы обойти эту проблему, мы можем использовать тонкую настройку — технику, состоящую в использовании предварительно обученной нейронной сети и ее настройке с использованием имеющихся у нас данных.

Пророк

Prophet — это библиотека с открытым исходным кодом, разработанная Facebook, которая делает именно то, что вы хотите. Это предварительно обученная нейронная сеть, простая в использовании и настраиваемая.

Вот результаты для тех же параметров, упомянутых выше

Как мы видим, Пророк дает нам интервал эволюции (голубой цвет). Черная и красная линии соответствуют эволюции долгосрочной процентной ставки.

Результат пока не впечатляет, но есть много вещей, которые можно сделать для его улучшения.

3. Ограничения и возможные улучшения

Есть несколько путей, которые можно изучить, чтобы попытаться получить лучшие результаты.

Во-первых, важно уточнить поиск предикторов. Действительно, цель состоит в том, чтобы попытаться предсказать эволюцию финансовой кривой с помощью индикаторов окружающей среды.

Это правда, что CO2 — это индикатор, часто используемый для оценки климата, но его влияние на финансы может быть слишком косвенным. Нам нужно найти этот предиктор и данные, которые с ним связаны. Более интересным подходом было бы попытаться предсказать "кредитный спред" (в данном случае процентную ставку, по которой банки готовы кредитовать компании в разных секторах) и сосредоточиться на экологических секторах. К сожалению, данных по кредитным спредам нет.

Во-вторых, всегда есть возможность протестировать различные модели, в частности VAR (модель векторной авторегрессии), которая также используется во временных рядах.

Для этапа моделирования процесса прогнозирования в настоящее время доступно лишь ограниченное количество инструментов. Отличный пакет прогнозирования Роба Хайндмана в R, вероятно, самый популярный вариант, и Google, и Twitter выпустили пакеты с более конкретной функциональностью временных рядов — CausalImpact и AnomalyDetection соответственно. Насколько нам известно, программного обеспечения с открытым исходным кодом для прогнозирования на Python немного.

Вывод

Эта статья является лишь наброском того, что возможно. Представленные методики — это только вершина айсберга.

В проекте еще многое предстоит сделать и улучшить. Машинное обучение предлагает множество возможностей, и появляется все больше и больше новых методов. Если появится надежная модель, она может стать очень хорошим инструментом поддержки принятия решений для компаний, которые хотят изменить свою климатическую политику.