Добро пожаловать в это захватывающее путешествие в мир обнаружения мошенничества с кредитными картами с использованием возможностей машинного обучения и Python! В этой статье я расскажу вам весь процесс построения надежной модели обнаружения мошенничества с использованием библиотеки Keras. Пристегнитесь, пока мы изучаем каждый шаг, от предварительной обработки данных до оценки модели, при этом добавляя удобные примеры кода и советы, которые сделают ваше обучение плавным и приятным.

Реализация доступна ниже:



Содержание

Исследование и понимание набора данных

Прежде чем мы перейдем к коду, давайте потратим немного времени на то, чтобы понять, с каким набором данных мы будем работать. Наш набор данных содержит данные о транзакциях по кредитным картам, представляющие собой смесь законных и мошеннических транзакций. Этот набор данных является примером несбалансированного набора данных, где законных транзакций (класс большинства) намного больше, чем мошеннических (класс меньшинства).

Теперь давайте углубимся в изучение структуры и характеристик набора данных.

!pip install -q scipy pandas scikit-learn tensorflow keras
import urllib.request
from scipy.io import arff
import pandas as pd

# Download the dataset to the current directory (149 MB)
# Source: https://www.openml.org/search?type=data&id=43627
url = "https://www.openml.org/data/download/22102452"
file_name = "credit_card.arff"
urllib.request.urlretrieve(url, file_name)

# Convert the dataset in arff format into a pandas dataframe
data_arff = arff.loadarff("credit_card.arff")
data = pd.DataFrame(data_arff[0])

data.head(3)
   Time        V1        V2        V3…