20210521-skearn onehotencoder 函數(shù)

兩種使用方法,

我自己開始用的比較麻煩的:

enc = preprocessing.OneHotEncoder()
enc.fit([[0],[1],[2]])
train_y = enc.transform(train_y).toarray()
def feature_onthot(col):
    enc = OneHotEncoder()
    enc.fit(np.array(category_dic[col]).reshape(-1,1))
    onehot_col = enc.transform(np.array(data[col]).reshape(-1,1)).toarray()
    return onehot_col

category_feature_sum = np.hstack((feature_onthot(i) for i in category_feature))

還有一種簡單的:
官網(wǎng)的例子:https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

>>> enc = OneHotEncoder(handle_unknown='ignore')
>>> X = [['Male', 1], ['Female', 3], ['Female', 2]]
>>> enc.fit(X)
OneHotEncoder(handle_unknown='ignore')
>>> enc.categories_
[array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
>>> enc.transform([['Female', 1], ['Male', 4]]).toarray()
array([[1., 0., 1., 0., 0.],
       [0., 1., 0., 0., 0.]])
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容