Я работаю с библиотекой imblearn для недостаточной выборки. У меня есть четыре класса в моем наборе данных, каждый из которых имеет 20, 30, 40 и 50 данных (поскольку это несбалансированный класс).
Но когда я пытаюсь выполнить недостаточную выборку набора данных с помощью «fit_resample (X, y)», он занижает только первый и последний классы.
Можно ли как-то недооценить все четыре класса, используя «imbleearn»?
Необходимый код:
undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)