ПОЛОЖИТЕЛЬНЫЙ

Финансовые учреждения все чаще обращаются к использованию машинного обучения (ML) для управления и анализа данных. Машинное обучение и ИИ (искусственный интеллект) - это область исследований, которая исходит из информатики, математики, психологии и философии. Его конечная цель - разработать систему, которая обеспечивает быстрое и прямое решение задачи. Процессы машинного обучения учатся на данных, которые были предложены системе, различая релевантные и нерелевантные шаблоны в данных. Он может делать прогнозы и отслеживать результат на основе данных в режиме реального времени. Сравнение характеристик машинного обучения и традиционных эконометрических моделей (например, ARIMA и GARCH) показало, что машинное обучение имеет огромное преимущество перед методами, предлагаемыми классической статистикой / эконометрикой (Sendhil Mullainathan, 2014). Алгоритмы машинного обучения могут управлять большим объемом как структурированных, так и неструктурированных данных и быстрее принимать решения и делать прогнозы. Такая превосходная производительность возможна, поскольку модели машинного обучения не делают никаких заранее определенных предположений о функциональной форме уравнения, взаимодействии между переменными и статистическом распределении параметров (Hamed Ghoddusi, 2019). В этой статье основное внимание уделяется общему подходу к наиболее распространенным техникам машинного обучения в подходе к оценке кредитоспособности, обсуждавшимся в последние годы, и выявлению положительных аспектов и слабых мест / критических замечаний в соответствии с основной литературой.

Финансовые учреждения сосредотачиваются на подходе к кредитному рейтингу и машинному обучению, согласно Маккинси и другим консалтинговым группам (2017), ML может принести прибыль в размере более 250 миллиардов долларов в банковской отрасли, но нормативные требования и структура проверки ограничивают использование ML в соответствии с Базельским соглашением. 3, поэтому многие банки осторожно используют машинное обучение только для приложений с низким уровнем риска (Martin Leo, 2019). По словам Марии Фернандес Видаль (2019), это также может помочь в развитии более справедливых и широких возможностей доступа к кредитам для тех, кто не обслуживается и не обслуживается банками. Машинное обучение - это автоматизированный процесс обучения с минимальным вмешательством человека или без него, он включает в себя программирование компьютеров, чтобы он мог учиться на имеющихся входных данных. С машинным обучением и лежащими в его основе алгоритмами вы можете легко исследовать данные и учиться на них (D Michie, 1968). Когда вы проанализировали миллион данных, он начинает обнаруживать закономерности, а это основа для предвидения. В последнее десятилетие интерес к большим данным возрос в различных областях, включая здравоохранение, управление и финансы (van Liebergen, Bart, 2017). Наш интерес заключается в том, как банки могут использовать машинное обучение в соответствии с основной литературой и как они могут интегрировать различные методы и подходы для получения ценных результатов. С теоретической точки зрения нормативно-правовые аспекты, от Базеля 1 до Базеля 3, позволили провести дополнительный анализ требований к капиталу и управления рисками, банкам необходимо проверить модель, поэтому использование неструктурированных данных изменит среду количественно и качественно (Доминик Гуган , 2019). Проект машинного обучения включает в себя следующие этапы:

  1. Подготовка данных и мои данные
  2. Алгоритмы процесса
  3. Характер - семья или организация.

Перед предоставлением кредита финансовые учреждения проверяют «кредитоспособность». Эта оценка называется «Кредитный скоринг» и представляет собой процесс, основанный на числовых выражениях, с помощью которого банки пытаются представить вероятность дефолта клиента по ссуде (Loretta j. Mester, 1997). В целом кредитная оценка подразделяется на два разных типа: оценка приложений и оценка поведения (Lyn C. Thomas, 2000). Оценка приложений предназначена для прогнозирования рисков неисполнения обязательств клиента и основана на демографической информации и записях кредитных бюро. Между тем, поведенческая оценка основана на бухгалтерских транзакциях клиентов. Согласно методу Свена Кроуна (2012), для разработки оценочной карты банкам нужна другая выборка, поскольку дерево решений и нейронная сеть нуждаются в выборке более 2000 для создания действительной модели, в то время как для создания действительной модели с помощью логистической регрессии требуется наблюдение с другой стороны. Ва Яп (Wah Yap, 2011) описывает основные методы интеллектуального анализа данных и в своем эмпирическом исследовании приходит к выводу, что система показателей с деревом решений / случайным лесом является наиболее надежной, если выборка данных достаточно велика.

Таким образом, менеджер банка основал свое решение на 5 ключевых моментах (D Michie, 2010).

  1. Капитал - какой у заявителя капитал и какова сумма кредита
  2. Обеспечение - если оно предложено надежно
  3. Емкость - окупаемость
  4. Состояние - общие прошлые и настоящие условия. Это наиболее значимая переменная согласно академическим исследованиям, а также промышленным / банковским результатам.
  5. Используя статистические методы, такие как логистическая регрессия, дерево решений или многомерная регрессия, банки могут создать свою собственную модель с прошлыми данными для расчета карты показателей (van Liebergen, Bart, 2017). Оценка по ключевым параметрам имеет основополагающее значение для понимания способности выплатить долг. Политики сосредотачиваются на этом, чтобы предотвратить другие банкротства банков, как это произошло в 2008 году. Регулирующие и надзорные органы вынуждали банки рассчитывать вероятность дефолта (PD), убыток в случае дефолта (LGD) и риск дефолта (EAD) для требований к капиталу, которые позволяют банкам предотвратить сбой в стрессовой ситуации, эти параметры используются для расчета ожидаемого убытка = pd x ead x lgd (Базельский комитет по банковскому надзору, 2005 г.) по всему портфелю ссуд, согласно рабочему документу ESRB (Henri Fraisse 2017). доказал, что потребность в капитале уменьшила ссуду, предоставляемую банками фирмам и частному сектору, что привело к ограничению кредита. Согласно литературным источникам и эмпирическим результатам выясняется, что банкам необходимо сосредоточиться на лучшей способности оценивать риск для оценки с помощью внутренних модельных рисков ссуд и снизить требования к капиталу, требуемые с помощью стандартного подхода Базеля 3. Машинное обучение - это мощный вычислительный инструмент. способ достичь этого результата, а также может открыть новый рынок ссуд: небанковские и недостаточно банковские ссуды не предоставляются, потому что до сегодняшнего дня мы не могли оценить эти две группы, согласно Международному валютному фонду (Маджид Базарбаш, 2019). Исследование, которое является ценным методом оценки кредитного рейтинга на основе информации, полученной со смартфона, социальной сети и психологического отношения, которое приведет к финансовой интеграции с одной стороны, но также приведет к открытию нового прибыльного рынка для банков. Этот рынок оценивается более чем 30% населения (Маджид Базарбаш, 2019). В розничном банкинге производительность и алгоритм машинного обучения зависят от логистики для классификации кандидатов по классам риска. Хорошая интерпретируемость результатов и простое объяснение - важнейшие достоинства этой процедуры (Hand and Kelly, 2002). Машинное обучение, по сути, всегда рассматривается как «черный ящик» (van Liebergen, Bart, 2017). Это обсуждение приводит к мнению регулирующего органа и лиц, определяющих политику, о том, что им нужны знания и надежные модели для анализа, и в большинстве исследований тот факт, что ML может быть «черным ящиком», является ключевой проблемой (Davide Castelvecchi, 2016). Вот почему логистическая регрессия в основном используется в кредитном скоринге, потому что обеспечивает надежный результат с известной частью статики, в соответствии с правилами Базеля 3 модель, разработанная банками для расчета PD, должна иметь классификацию с точностью, калибровкой и стабильностью.

Информатика автоматизирует эту процедуру, стремясь снизить стоимость оценки кредита и убытков по ссудам, вызванных дефолтом клиентов, и, начиная с статики 90-х годов, разрабатывает методы оценки этих рисков. Кредитный скоринг, реализованный с помощью кредитной карты, которая присваивает баллы ключевым характеристикам и аспектам клиентов для оценки рисков, основанных на анализе данных машинного обучения, может дать более ценный результат, чем традиционные методы. (Артем Беке, 2017)

Изучив основную литературу по машинному обучению в кредитном скоринге, мы можем сделать вывод, что это особенно мощный инструмент для прогнозирования путем выявления взаимосвязей или закономерностей в выборке данных. Это можно делать тысячи раз, чтобы модель могла «учиться» на данных и улучшать свои прогнозные характеристики. Из-за того, что машинное обучение полагается на большие наборы данных и большие вычислительные мощности, оно тесно связано с «революцией больших данных». Машинное обучение может работать с огромным объемом данных, которые могут помочь оптимизировать процессы и, в нашем случае, кредитный скоринг. Анализ огромного количества данных за короткое время может принести пользу: управление деньгами и экономия времени. Его можно использовать для новой ссуды и позволить большему количеству людей легко получить доступ к кредиту.

ОТРИЦАТЕЛЬНЫЙ

Риски в моделях машинного обучения проистекают из повышенной сложности модели, поэтому менеджеры банков рассматривают машинное обучение как черный ящик с неизвестной функцией (Davide Castelvecchi, 2016). Эти опасения относятся к числу препятствий, которые сдерживают ML или вызывают беспокойство у нынешних приверженцев ML. Политики жалуются. Проблемы включают в себя черный ящик некоторых подходов к ML (Базель 3), возможные дискриминационные решения, которые могут быть приняты алгоритмами AI, а также подотчетность и ответственность, когда система ML вовлечена в нежелательный результат. Итак, сосредоточив внимание на недостатках, мы можем сказать, что, согласно Лоре Аурия (2008), время для разработки хороших и надежных алгоритмов машинного обучения, а также интерпретация результатов являются основными недостатками. Вдобавок ко всему существует предвзятость, которая может спутать данные и привести к неверному решению (Шичао Чжан).

ЗАКЛЮЧЕНИЕ

Социальные проблемы, такие как банкротство банка из-за того, что людям не разрешен доступ в кредит из-за неправильной модели, могут легко привести к статической ситуации, когда нет никакого роста, а затем снижение не только для той части, которая хочет получить ссуду, но и для банк. Это может вызвать падение доходов и, возможно, начать уделять больше внимания инвестициям, поскольку торговля для компенсации потери кредита (Henri Fraisse 2017). По словам Мартина Лео (2019), инвестиции в эту технологию важны, и существует необходимость не только в валидации модели (Базель 3), но и в отделе, который ежедневно контролирует результат ML для предотвращения как можно большего количества ошибок. что могло возникнуть. ML - это мощная технология, которая окажет огромное влияние на нашу жизнь (Hamed Ghoddusi, 2019). Однако, чтобы полностью оценить ее потенциальные преимущества, нам необходимо создать систему доверия как к технологии, так и к тем, кто ее производит (Seng Huat Ong 2011). Проблема предвзятости может быть решена с помощью надежных и проверенных возможностей обнаружения и смягчения предвзятости, а также важность объяснения того, как принимается их решение, может побудить разработчика машинного обучения создать мост между доверием и эффективным путем для экономического роста и социальной выгоды, используя это. технологии (Мария Фернандес Видаль, 2019).

Определение проблемы: оценка кредитоспособности и выбор политики

Репозиторий методов машинного обучения в кредитном скоринге: «кликни меня»

МАШИННОЕ ОБУЧЕНИЕ В КРЕДИТНОМУ ОЦЕНИВКУ ВКУСА ЛИТЕРАТУРЫ