Фахмид Кабир Опубликовано в Блог компании Databricks, 13 июля 2021 г.

Мошенничество — это дорогостоящая и растущая проблема: по оценкам исследований, 1 доллар мошенничества обходится компаниям в 3,36 раза дороже, чем возврат средств, замена и эксплуатационные расходы. Вдобавок ко всему, по мнению экспертов, недостаточно правил для защиты малого бизнеса от возвратных платежей и убытков от мошенничества. Несмотря на значительный прогресс в области мошенничества с кредитными картами, методы управления рисками адаптировались, и мошенники все еще могут находить лазейки и использовать систему. Для компаний, выпускающих кредитные карты, угроза мошеннического использования карт является постоянной, что приводит к необходимости точных систем обнаружения мошенничества с кредитными картами. Все организации подвержены риску мошенничества и мошеннических действий, но этот риск особенно обременителен для тех, кто занимается финансовыми услугами. Угрозы могут исходить из внутренних или внешних источников, но последствия могут быть разрушительными — включая потерю доверия потребителей, тюремное заключение для тех, кто причастен к этому, и даже крах корпораций, — говорит Бадриш Давай, руководитель отдела обработки данных и машинного обучения в Capital One. . CNBC сообщает, что США являются самой подверженной мошенничеству с кредитными картами страной в мире.

Обнаружение мошенничества с помощью машинного обучения
Однако это еще не все плохие новости. Благодаря современным достижениям предприятия могут опережать угрозы, используя данные и машинное обучение. В рамках технологического доклада на недавнем саммите Data + AI Summit мы смогли получить представление о том, как Capital One использует данные и искусственный интеллект (ИИ) для борьбы с мошенничеством. Бадриш Давай из Capital One рассказал, как мы можем использовать самые современные алгоритмы машинного обучения, чтобы опережать злоумышленников и в то же время постоянно узнавать новые способы использования системы. Чтобы более динамично выявлять мошеннические транзакции, можно обучать модели машинного обучения на наборе данных, включая данные о транзакциях по кредитным картам, а также карточную и демографическую информацию о держателе карты. Capital One использует Databricks для достижения этой цели, — отметил Давай.

Capital One анализирует все мошеннические действия, чтобы понять, на что обращать внимание при мошенничестве с кредитными картами. Давай представил 6 вопросов, которые они задают: что, кто, когда, где, почему и что, если? — используется для выявления тенденций мошеннической деятельности. Дэвей рассказал о различных сценариях, в которых информация о карте может быть скомпрометирована, и о том, как данные могут помочь в обнаружении аномалий и выявлении мошенничества. Например, он поделился тем, как геопространственные данные могут обнаруживать украденную информацию о карте, когда она используется вне ее фактического местоположения, а также временные данные для выявления мошенничества.

Как также объяснил Дэвей, когда клиент физически теряет карту, но не уведомляет организацию, контекстная информация (например, рабочее время, привычки расходов и т. д.) может помочь определить, являются ли транзакции обычными или аномальными. Ключевой вывод Дэвея заключается в том, что мы должны иметь возможность объединять несколько независимых сигналов вместе, чтобы получить более широкий контекст вокруг данных о тракции и демографических данных. Благодаря доступности данных и достижений в области машинного обучения предотвращение мошенничества является ключевой областью, в которой машинное обучение меняет как рабочие процессы, так и результаты, позволяя организациям опережать все более технологически продвинутых преступников.

Сегодняшние предприятия сталкиваются со все более изощренным врагом, который очень быстро атакует, реагирует и меняет тактику. Из-за динамики мошенничества организациям необходим ИИ, чтобы постоянно адаптироваться к меняющемуся поведению и шаблонам. ИИ обеспечивает гибкость, которой нет в правилах. С помощью аналитики данных и машинного обучения компании могут опередить угрозы. Ниже приведены некоторые основные причины, по которым ML может использоваться для борьбы с мошенничеством:

  • Мошенничество скрывается за огромными объемами данных. Самый эффективный способ обнаружить мошенничество — изучить поведение конечных пользователей в целом. Просмотра транзакций или заказов недостаточно — нам нужно следить за событиями, предшествовавшими транзакции и после нее. Это приводит к большому количеству структурированных и неструктурированных данных, и лучший способ обнаружить мошенничество в таких огромных объемах — это машинное обучение и искусственный интеллект.
  • Мошенничество происходит быстро: когда система машинного обучения обновляется в режиме реального времени, эти знания можно использовать в течение миллисекунд для обновления моделей обнаружения мошенничества и предотвращения атаки.
  • Мошенничество постоянно меняется:мошенники постоянно меняют свои тактики, что затрудняет их обнаружение людьми и делает невозможным их обнаружение для статичных систем, основанных на правилах, которые не обучаются. Однако машинное обучение может адаптироваться к изменению поведения.
  • На первый взгляд мошенничество выглядит нормально. Для человеческого глаза мошеннические и обычные транзакции ничем не отличаются друг от друга. ML имеет более глубокий и тонкий способ просмотра данных, что помогает избежать ложных срабатываний.

Дэвей обсудил, как ML использует статистические модели, такие как классификаторы и логистическую регрессию, для просмотра прошлых результатов и аномалий для прогнозирования будущих результатов. Система машинного обучения может обучаться, прогнозировать и принимать решения по мере поступления данных в режиме реального времени. В своей презентации Дэвей рассказал, что должна иметь хорошая модель предотвращения мошенничества:

  • универсальный магазин для пользователей, позволяющий обучать модель и организовывать выполнение
  • Обнаружение в реальном времени
  • Глубокая аналитика и моделирование с использованием мощных инструментов машинного обучения, таких как глубокое обучение и нейронные сети, для что, еслианализа данных и проверки новых гипотез.
  • Соблюдение политики безопасности компании и требований соответствия
  • Служба уведомлений для немедленного информирования держателей карт о подозрительной активности
  • Полная интеграция с корпоративными системами

MLflow в предотвращении мошенничества
Дэвей подчеркнул ценность Databricks и MLflow в их усилиях по предотвращению мошенничества. Он рассказал о платформе и о том, как различные команды по работе с данными и мошенничеству совместно разрабатывают и проводят эксперименты с командой, использующей Databricks. Несмотря на то, что они совместно используют эксперименты и данные внутри команды, мы можем применять строгие меры безопасности для соблюдения конфиденциальности данных, и каждый эксперимент может иметь свои собственные вычислительные среды и требования, — сказал Давай. Он назвал Databricks универсальным магазином для всей [их] науки о данных и моделей, что делает его идеальным для проектов по науке о данных. Когда команда определила функции для прогнозирования того, является ли транзакция мошеннической или нет, они передают эти точки данных в размещенную среду Databricks, где затем могут выполнять разработку функций, предварительную обработку данных и разбивать данные на тестовые и обучающие наборы. Затем они используют различные контролируемые или неконтролируемые алгоритмы машинного обучения, такие как SVM, дерево решений и случайный лес, для обучения модели. Они определяют наиболее эффективную модель и используют платформу Databricks Lakehouse для устранения мошенничества непосредственно внутри платформы. Lakehouse — это благоприятная среда для обнаружения мошенничества, и вы можете узнать больше от наших ускорителей решений здесь.

Дэвей упомянул, что «MLflow в экосистеме Databricks — это отличная функция, которую мы можем использовать, поскольку она имеет множество преимуществ в беспрепятственной разработке конвейера рабочего процесса ML». MLflow позволяет Capital One отслеживать свои эксперименты с машинным обучением от начала до конца на протяжении всего жизненного цикла модели машинного обучения. Во время выступления Дэвей упомянул, что они могут запускать эксперименты непосредственно из GitHub без необходимости просматривать код, а также могут напрямую развертывать и обучать модели, сериализуя их, используя такие пакеты, как модуль pickle Python, Apache Spark и MLflow. Затем они развертывают сериализованную модель и используют ее в качестве API, используя MLflow.

MLflow и микросервисы
Давай также коснулся микросервисов и их полезности в MLflow. Микросервис — это шлюз к определенному функциональному аспекту приложения. Это помогает таким командам, как Capital One, разрабатывать приложения стандартизированным и последовательным образом с течением времени. Микросервисы позволяют Capital One развертывать функциональные возможности приложений независимо друг от друга. Это помогает абстрагироваться от функциональности, позволяя команде создать повторно используемый и унифицированный способ взаимодействия с приложением. Кроме того, он позволяет командам создавать сложные модели поведения, объединяя множество других микросервисов. По сути, это позволяет компаниям использовать любой технологический стек в серверной части, сохраняя при этом совместимость во внешнем интерфейсе.

С необработанными данными Capital One, хранящимися в Amazon S3, они быстро интегрируют взаимодействие между S3 и их инфраструктурой через Databricks и могут массово масштабировать конвейеры обучения, проверки и развертывания моделей машинного обучения с помощью MLflow. Их команда обучает и проверяет модели на пользовательских кластерах в AWS и развертывает их через SageMaker напрямую с помощью API-интерфейсов MLflow. MLflow не ограничивается только ИИ, но может встраивать любую часть бизнес-логики (как указано в правилах Databricks + ИИ-ускоритель) и, таким образом, извлекает выгоду из принципов управления и доставки E2E в виде микросервисов.

Собираем все вместе
Дэвей рассказал, как Databricks позволяет Capital one запрашивать и развертывать модели, а также управлять развертыванием и очищать его, используя API-интерфейсы MLflow в экосистеме AWS. Кроме того, они могут обеспечить безопасную безопасность и условный доступ через AWS SSO.

Основываясь на наблюдениях Capital One и многих других клиентов, использование данных и ИИ для предотвращения мошенничества дает несколько преимуществ, в том числе:

  • Уменьшена потребность в ручном просмотре. Машинное обучение автоматизирует процессы, в которых поведение можно изучать на индивидуальном уровне и выявлять аномалии.
  • Возможность предотвращать случаи мошенничества, не мешая работе пользователя. ИИ плавно автоматизирует процесс и заранее предотвращает мошенничество, не обременяя пользователей.
  • Более низкие эксплуатационные расходы по сравнению с другими подходами. Благодаря меньшему количеству ручной работы и автоматизации данные и искусственный интеллект требуют меньше ресурсов и предотвращают потери, связанные с мошенничеством.
  • Высвобождает время команды, чтобы сосредоточиться на более стратегических задачах. Большинство компаний не занимаются обнаружением мошенничества, и процесс предотвращения мошенничества с машинным обучением может помочь им сосредоточиться на основной деятельности.
  • Быстро адаптируется. В сочетании с человеческим талантом и опытом данные и ИИ работают вместе, чтобы постоянно учиться и приспосабливаться к новому поведению и тенденциям пользователей.

Когда дело доходит до оперативного использования данных и искусственного интеллекта для построения отношений с клиентами и повышения рентабельности капитала, мошенничество должно считаться главным приоритетом. Борьба с мошенническим или злонамеренным поведением — от мошеннических транзакций по картам — является ключом к смягчению негативного влияния на доход. Для более динамичного обнаружения мошеннических транзакций Capital One использует информацию о ML и транзакциях по кредитным картам, а также данные о картах и ​​демографические данные, чтобы получить всестороннее представление для выявления аномалий. Новаторы, основанные на данных, такие как Capital One, прокладывают путь к обнаружению мошенничества и предлагают успешную модель для защиты клиентов и бизнеса.

Полный блог здесь: https://databricks.com/blog/2021/07/13/using-your-data-to-stop-credit-card-fraud-capital-one-and-other-best-practices.html