Добро пожаловать в это захватывающее путешествие в мир обнаружения мошенничества с кредитными картами с использованием возможностей машинного обучения и Python! В этой статье я расскажу вам весь процесс построения надежной модели обнаружения мошенничества с использованием библиотеки Keras. Пристегнитесь, пока мы изучаем каждый шаг, от предварительной обработки данных до оценки модели, при этом добавляя удобные примеры кода и советы, которые сделают ваше обучение плавным и приятным.
Реализация доступна ниже:
Содержание
- Исследование и понимание наборов данных
- Предварительная обработка: очистка и подготовка данных
- Построение модели бинарной классификации
- Обучение модели
- Оценка: измерение эффективности модели
- "Заключение"
Исследование и понимание набора данных
Прежде чем мы перейдем к коду, давайте потратим немного времени на то, чтобы понять, с каким набором данных мы будем работать. Наш набор данных содержит данные о транзакциях по кредитным картам, представляющие собой смесь законных и мошеннических транзакций. Этот набор данных является примером несбалансированного набора данных, где законных транзакций (класс большинства) намного больше, чем мошеннических (класс меньшинства).
Теперь давайте углубимся в изучение структуры и характеристик набора данных.
!pip install -q scipy pandas scikit-learn tensorflow keras import urllib.request from scipy.io import arff import pandas as pd # Download the dataset to the current directory (149 MB) # Source: https://www.openml.org/search?type=data&id=43627 url = "https://www.openml.org/data/download/22102452" file_name = "credit_card.arff" urllib.request.urlretrieve(url, file_name) # Convert the dataset in arff format into a pandas dataframe data_arff = arff.loadarff("credit_card.arff") data = pd.DataFrame(data_arff[0]) data.head(3) Time V1 V2 V3…