可以實(shí)現(xiàn)實(shí)現(xiàn)子樣本生成和子樣本選取。
子樣本生成:生成的數(shù)據(jù)子集小且不屬于原數(shù)據(jù)集
子樣本選取:生成的數(shù)據(jù)子集小且屬于原數(shù)據(jù)集
from imblearn.under_sampling import RandomUnderSampler
rus = RandomUnderSampler(random_state=0)
X_resampled, y_resampled = rus.fit_resample(X, y)
print(sorted(Counter(y_resampled).items()))
X,y均為numpy的數(shù)據(jù)結(jié)構(gòu)
上述代碼實(shí)現(xiàn)子樣本選取,修改RandomUnderSampler的參數(shù)可以自定義選取的模式,如按比例個(gè)數(shù)選取等等。