Публикации по теме 'imblearn'


Что такое несбалансированные данные? Как обрабатывать несбалансированные данные в python?
В машинном обучении иногда, когда мы решаем задачи классификации, мы видим, что один класс имеет точность 95% (класс 1), тогда как другой класс имеет точность всего 7,5% (класс 0). Что ж, можно подумать, почему такая диспропорция точности возникает в нашем проекте? Чтобы понять причину этой несоразмерности, нам нужно сначала понять следующие моменты. Что такое несбалансированный набор данных? В чем разница между несбалансированной и несбалансированной классификацией (набором данных)?..

Вопросы по теме 'imblearn'

Использование imblearn для передискретизации данных нескольких классов
Я хочу использовать функцию RandomOverSampler из модуля imbalanced-learn для выполнения передискретизации данных с более чем двумя классами. Ниже приведен мой код с 3 классами: import numpy as np from imblearn.over_sampling import...
3834 просмотров
schedule 08.09.2022

SMOTE с пропущенными значениями
Я пытаюсь использовать SMOTE из пакета imblearn в Python, но в моих данных много пропущенных значений, и я получил следующую ошибку: ValueError: Вход содержит NaN, бесконечность или значение слишком велико для dtype('float64'). Я...
4501 просмотров
schedule 28.01.2023

Пропустить некоторые этапы преобразования (связанные с избыточной и недостаточной выборкой) в конвейере несбалансированного обучения при прогнозировании набора тестовых данных [дубликаты]
Для проблемы несбалансированной классификации я использую конвейер imblearn вместе с GridSearchCV sklearn (чтобы найти лучшие гиперпараметры). Шаги в конвейере следующие: Стандартизируйте каждую функцию Исправьте дисбаланс классов с помощью...
200 просмотров

Передискретизация Python объединяет несколько семплеров в конвейер
Моя проблема связана с ошибкой значения, вызванной классом SMOTE. Ожидаемые n_neighbors ‹= n_samples, но n_samples = 1, n_neighbors = 6 # imbalanced learn is a package containing impelementation of SMOTE from imblearn.over_sampling import...
1045 просмотров

Как выполнить недостаточную/передискретную выборку набора данных более чем двух классов, используя библиотеку imblearn в Python?
Я работаю с библиотекой imblearn для недостаточной выборки. У меня есть четыре класса в моем наборе данных, каждый из которых имеет 20, 30, 40 и 50 данных (поскольку это несбалансированный класс). Но когда я пытаюсь выполнить недостаточную выборку...
150 просмотров

Проблема с imblearn: SMOTENC TypeError: '‹' не поддерживается между экземплярами 'int' и 'str'
Я использую SMOTENC для решения проблемы несбалансированной классификации. df_train, df_test = train_test_split(input_table_1_df, test_size=0.25, stratify=input_table_1_df["Target_Variable_SX_FASCIA_1"]) ######...
47 просмотров
schedule 28.08.2022

Imblearn SMOTE: как установить параметр sample_strategy для набора данных мультиклассового дисбаланса?
Я пытаюсь обработать набор данных с сетевыми атаками, который имеет следующую форму: df.shape (1074992, 42) А метки атак и нормальное поведение имеют следующий подсчет: df['Label'].value_counts() normal 812814 neptune...
112 просмотров