Гарвин Ли

Система показателей — это распространенный метод, используемый в сфере оценки кредитных рисков и интернет-финансирования. Scorecard не просто соответствует определенному алгоритму машинного обучения, а является универсальной структурой моделирования. Он делит исходные данные на ячейки, выполняет проектирование признаков данных, а затем применяет данные в линейных моделях для моделирования.

Принцип моделирования системы показателей применяется в различных областях оценки кредитоспособности, таких как оценка риска кредитной карты и выдача кредита. Кроме того, оценочная карта часто используется для оценки в таких сценариях, как оценка обслуживания клиентов и оценка кредита Zhima (кредитная оценка Alipay). В этой статье используется конкретный случай, чтобы объяснить, как использовать финансовые компоненты Alibaba Cloud Платформа машинного обучения для ИИ для создания сценария моделирования системы показателей.

Щелкните Загрузить еще, чтобы установить эксперимент с системой показателей непосредственно из шаблона, как показано на следующем снимке экрана. Этот шаблон содержит процессы и данные всего эксперимента.

Введение в набор данных

На предыдущем снимке экрана показан набор данных с открытым исходным кодом из иностранного учреждения, включающий 30 000 элементов данных. Набор данных включает в себя свойства пользователя, такие как пол, уровень образования, семейное положение и возраст, а также записи об использовании кредитной карты каждого пользователя и счета за прошедший период времени. payment_next_month — это целевая очередь, указывающая, оплачивает ли пользователь счет по кредитной карте (1 означает, что счет был оплачен, 0 — что счет не был погашен).

Набор данных можно загрузить с https://www.kaggle.com/uciml/default-of-credit-card-clients-dataset.

Процесс эксперимента

На следующей диаграмме показан процесс эксперимента.

Шаг 1: Разделение

Разделите входной набор данных на две части: одна часть используется для обучения модели, а другая — для прогнозирования оценки.

Шаг 2: Биннинг

Компонент биннинга аналогичен горячему кодированию и может отображать данные в соответствии с их распределением в функции с более высокими размерами. Возьмем, к примеру, поле «возраст». Компонент биннинга может выполнять биннинг в соответствии с распределением данных в разных интервалах. На следующем снимке экрана показаны результаты биннинга.

Окончательный результат компонента биннинга показан на следующем снимке экрана. Каждое поле разбито на несколько интервалов.

Шаг 3: Индекс стабильности населения (PSI)

PSI — важная метрика для измерения смещения из-за изменений выборки. PSI обычно используется для оценки стабильности образца. Например, стабильны ли изменения выборки между двумя месяцами. В целом переменное значение PSI ниже 0,1 указывает на незначительные изменения; значение PSI от 0,1 до 0,25 указывает на значительные изменения; значение PSI больше 0,25 указывает на исключительно значительные изменения, которые могут потребовать особого внимания.

В этом случае при сравнении значений PSI до и после разделения данных, а также значений PSI результатов бинирования возвращается значение PSI каждой функции, как показано на следующем снимке экрана.

Шаг 4: Обучение системе показателей

Результаты обучения по системе показателей показаны на следующем снимке экрана.

Суть системы показателей заключается в представлении весов сложной модели в виде оценок, соответствующих бизнес-стандартам.

  1. перехват: перехват
  2. Без масштабирования: исходные значения веса.
  3. Scaled: метрика изменения оценок. Например, если функция «pay_0» попадает в интервал (-1,0], ее оценка будет уменьшена на 29; если функция попадает в интервал £¨0£¬1], ее оценка добавит 27.
  4. Важность: влияние каждой функции на результат. Чем больше значение, тем сильнее влияние.

Шаг 5: Прогноз системы показателей

Окончательные оценки каждого результата прогнозирования (в данном случае кредитные оценки пользователей).

Вывод

На основе записей о потреблении кредитных карт пользователями окончательный кредитный рейтинг каждого пользователя получается с помощью обучения модели оценочной карты и прогнозирования оценочной карты. Эти окончательные кредитные баллы могут применяться в областях кредитного расследования, связанных с кредитами или финансами.

Посетите страницу Alibaba Cloud Machine Learning Platform for AI, чтобы познакомиться с возможностями машинного обучения Alibaba Cloud уже сегодня!

Ссылка: https://www.alibabacloud.com/blog/scorecard-credit-scoring-on-alibaba-clouds-machine-learning-platform_594276?spm=a2c41.12435540.0.0