Авторы | Суббу Венкатараманан, Гунгор Озер

Понимание и интерпретация моделей кредитного риска

Кредитные рейтинги предназначены для измерения вероятности того, что заемщик полностью погасит ссуду. Существует множество кредитных рейтингов, которые моделируют вероятность дефолта по ссуде в зависимости от характеристик заемщика, таких как длина кредитной истории, использование кредита, история погашения, запросы и т. Д. комбинация:

  • Своевременная история платежей
  • Использование общей кредитной линии
  • Продолжительность кредитной истории
  • Типы используемых кредитов
  • Недавние «новые» запросы на кредит

для квантования вероятности погашения / дефолта. Таким образом, когда принимается «неблагоприятное» кредитное решение, такое как отклонение заявки, оно явно может быть связано с такими причинами, как «Слишком высокий возобновляемый баланс кредитной линии», «Серьезная просрочка за последние 5 лет» и т. Д. Такая объяснимость имеет решающее значение, поскольку Федеральные нормативные акты требуют, чтобы финансовые учреждения указали «причины неблагоприятных действий» отказавшимся заемщикам. Недостаточно сказать, что «кредитный рейтинг слишком низкий». С точки зрения клиента (заемщика) причины помогают им понять, какие действия им необходимо предпринять, чтобы улучшить свой кредитный рейтинг и, следовательно, вероятность принятия кредита.

Большинство систем оценки, хотя и являются полезными, могут привести к ложным выводам и отказу в предоставлении кредита многим кредитоспособным кандидатам. Это связано с тем, что эти системы оценки используют линейные / менее сложные «мелкие» модели, такие как логистическая регрессия, которые работают достаточно хорошо, когда объем данных и количество параметров / предикторов (экзогенных переменных) невелико. Однако по мере роста данных и количества предикторов точность линейных моделей снижается.

Учитывая, что количество (характеристики кредита на уровне торговой линии, сроки, последовательность и история погашения) и разнообразие (альтернативные источники данных) данных, доступных по заемщикам, резко возрастают, разработчикам моделей кредитного риска нужны более сложные глубокие алгоритмы машинного обучения, которые могут изучить больше сложные, нелинейные функции. Например, модели нейронных сетей показали более высокую точность, когда данные большие.

Парадокс здесь в том, что большинство сложных алгоритмов машинного обучения используют нелинейные отношения, которые нелегко объяснить. Для многих секторов и отраслей, включая финансовый мир, модели должны быть объяснимыми, чтобы они могли внедрять их в свою повседневную деятельность в соответствии с правительственными постановлениями и удовлетворением ожиданий клиентов.

Войдите в глубокое обучение

Сегодня даже персональные компьютеры оснащены вычислительными мощностями, которые могут хранить / обрабатывать гигабайты данных. С технологической точки зрения мы можем эффективно обрабатывать терабайты данных с помощью кластеров процессоров (HPC) благодаря распределенным вычислениям и быстрым алгоритмам. Одним из таких алгоритмов являются нейронные сети, которые теперь называют «глубоким обучением», особенно когда есть несколько скрытых слоев. Этот метод описывает очень сложные нелинейные отношения между большим количеством функций (функции уровня торговой линии, альтернативные функции данных и т. Д.) И результатом (вероятностью возврата).

Нейронные сети широко используются при обработке изображений / звука / речи / текста и дают невероятные результаты для различных задач классификации и регрессии. Ниже приведен ограниченный список различных нейронных сетей и примеры задач моделирования, для которых они используются, для уточнения их текущих приложений:

Нейронные сети (NN) для моделирования кредитного риска

Хотя NN очень полезны в моделях классификации с высокой точностью и чрезвычайно успешно фиксируют сложные нелинейные отношения между огромным количеством переменных и результатом, они не создают простых коэффициентов модели. Создается впечатление, что это модели черного ящика, но это не совсем так. В некоторой степени их можно объяснить с помощью анализа чувствительности. Однако до сих пор эти модели ускользали от возможности полностью соответствовать нормативным требованиям, включая обоснование неблагоприятных действий. Это, в свою очередь, делает обычные / немодифицированные модели нейронных сетей непригодными для кредитного андеррайтинга. По этой причине, несмотря на более низкую точность, финансовые учреждения по-прежнему предпочитают более простые «неглубокие» модели, такие как логистическая регрессия.

Объяснимые нейронные сети от Scienaptic

В Scienaptic Systems мы разработали новый алгоритм нейронной сети (NN), который повысит точность предсказания андеррайтинга, преодолевая при этом ограничения объяснимости обычных моделей нейронных сетей. Этот революционный алгоритм может быть применен к любой проблеме контролируемого обучения, такой как моделирование кредитного риска для финансовых учреждений.

Новый объяснимый алгоритм NN Scienaptic предлагает эффективный способ дискретизации числовых входных данных, который не зависит от числового диапазона, для создания объяснимой нейронной сети. Этот метод автоматизирован по своей природе и, следовательно, также снижает потребность в проектировании функций, что экономит значительные трудозатраты и вычислительные ресурсы при ручном вмешательстве. Используя оптимизированный пакет TensorFlow, он применим к большим наборам данных и предоставляет банкам и другим кредитным учреждениям мощь высокопрогнозируемых и объяснимых моделей глубокого обучения, которые позволят повысить уровень одобрения и снизить уровень потерь.

По сути, новый алгоритм отображает все экзогенные переменные в оптимизированные сегменты и в окончательный прогноз. Благодаря этой связи смоделированные отношения можно легко объяснить. Например, можно легко указать такую ​​причину, как «Слишком много возобновляемых торговых запросов за последние три месяца», потому что количество таких запросов может попасть в корзину, скажем, от 5 до 8, что в десять раз превышает показатель по умолчанию по сравнению со средним. Обратите внимание, что оптимизации / преобразования требуют минимального внешнего ввода, а это означает, что ручное вмешательство практически не требуется.

Алгоритм также предоставляет диапазоны оценок, такие как FICO. И результирующая модель является убедительной для каждой из добавленных метрик, таких как выводы корзины FICO, например, ИСКЛЮЧИТЕЛЬНЫЕ (FICO = 800+) заемщики имеют только 1% ставки дефолта или ЯВНАЯ (579 ‹FICO‹ 670) вероятнее всего выберет дефолт 27. раз из 100.

В этом смысле инновационный алгоритм Scienaptic - это шаг вперед к столь необходимой объяснимости сложных нейронных сетей для кредитного андеррайтинга и моделирования рисков. Такая объяснимость - в сочетании с высокой точностью глубокого обучения - будет иметь большое значение для моделей кредитного андеррайтинга, поскольку поможет удовлетворить федеральные нормы и ожидания потребителей. Успешное внедрение приведет к более высокому уровню одобрения для квалифицированных заемщиков и снижению риска для финансовых организаций: ВЫИГРЫВАЙ-ВЫИГРЫША!