Как выполнить недостаточную/передискретную выборку набора данных более чем двух классов, используя библиотеку imblearn в Python?

Я работаю с библиотекой imblearn для недостаточной выборки. У меня есть четыре класса в моем наборе данных, каждый из которых имеет 20, 30, 40 и 50 данных (поскольку это несбалансированный класс).

Но когда я пытаюсь выполнить недостаточную выборку набора данных с помощью «fit_resample (X, y)», он занижает только первый и последний классы.

Можно ли как-то недооценить все четыре класса, используя «imbleearn»?

Необходимый код:

undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)

person RAWNAK YAZDANI    schedule 31.05.2020    source источник


Ответы (1)


Проблема была решена установкой smaling_strategy='all'.

person RAWNAK YAZDANI    schedule 01.06.2020