Публикации по теме 'imblearn'
Что такое несбалансированные данные? Как обрабатывать несбалансированные данные в python?
В машинном обучении иногда, когда мы решаем задачи классификации, мы видим, что один класс имеет точность 95% (класс 1), тогда как другой класс имеет точность всего 7,5% (класс 0). Что ж, можно подумать, почему такая диспропорция точности возникает в нашем проекте? Чтобы понять причину этой несоразмерности, нам нужно сначала понять следующие моменты.
Что такое несбалансированный набор данных? В чем разница между несбалансированной и несбалансированной классификацией (набором данных)?..
Вопросы по теме 'imblearn'
Использование imblearn для передискретизации данных нескольких классов
Я хочу использовать функцию RandomOverSampler из модуля imbalanced-learn для выполнения передискретизации данных с более чем двумя классами. Ниже приведен мой код с 3 классами:
import numpy as np
from imblearn.over_sampling import...
3834 просмотров
schedule
08.09.2022
SMOTE с пропущенными значениями
Я пытаюсь использовать SMOTE из пакета imblearn в Python, но в моих данных много пропущенных значений, и я получил следующую ошибку:
ValueError: Вход содержит NaN, бесконечность или значение слишком велико для dtype('float64').
Я...
4501 просмотров
schedule
28.01.2023
Пропустить некоторые этапы преобразования (связанные с избыточной и недостаточной выборкой) в конвейере несбалансированного обучения при прогнозировании набора тестовых данных [дубликаты]
Для проблемы несбалансированной классификации я использую конвейер imblearn вместе с GridSearchCV sklearn (чтобы найти лучшие гиперпараметры). Шаги в конвейере следующие:
Стандартизируйте каждую функцию
Исправьте дисбаланс классов с помощью...
200 просмотров
schedule
11.07.2023
Передискретизация Python объединяет несколько семплеров в конвейер
Моя проблема связана с ошибкой значения, вызванной классом SMOTE.
Ожидаемые n_neighbors ‹= n_samples, но n_samples = 1, n_neighbors = 6
# imbalanced learn is a package containing impelementation of SMOTE
from imblearn.over_sampling import...
1045 просмотров
schedule
20.08.2022
Как выполнить недостаточную/передискретную выборку набора данных более чем двух классов, используя библиотеку imblearn в Python?
Я работаю с библиотекой imblearn для недостаточной выборки. У меня есть четыре класса в моем наборе данных, каждый из которых имеет 20, 30, 40 и 50 данных (поскольку это несбалансированный класс).
Но когда я пытаюсь выполнить недостаточную выборку...
150 просмотров
schedule
12.10.2022
Проблема с imblearn: SMOTENC TypeError: '‹' не поддерживается между экземплярами 'int' и 'str'
Я использую SMOTENC для решения проблемы несбалансированной классификации.
df_train, df_test = train_test_split(input_table_1_df, test_size=0.25, stratify=input_table_1_df["Target_Variable_SX_FASCIA_1"])
######...
47 просмотров
schedule
28.08.2022
Imblearn SMOTE: как установить параметр sample_strategy для набора данных мультиклассового дисбаланса?
Я пытаюсь обработать набор данных с сетевыми атаками, который имеет следующую форму:
df.shape
(1074992, 42)
А метки атак и нормальное поведение имеют следующий подсчет:
df['Label'].value_counts()
normal 812814
neptune...
112 просмотров
schedule
12.09.2022