sklearn.pipeline 之 Pipeline

sklearn 的轉(zhuǎn)換器通常與分類器,回歸器或者其他的評估器組合以構(gòu)建復(fù)合評估器。常用的工具是 Pipeline。Pipeline 通常用于與特征單元結(jié)合,將轉(zhuǎn)換器的輸出連接到復(fù)合的特征空間。TransformedTargetRegressor 用于轉(zhuǎn)換標(biāo)簽(target),相反 Pipeline 僅轉(zhuǎn)換觀測數(shù)據(jù)(X)。

Pipeline 可將多個(gè)評估器鏈接為一個(gè),順序執(zhí)行每個(gè)評估器。這很有用,因?yàn)樘幚頂?shù)據(jù)通常有固定的步驟,例如特征選擇,歸一化和分類。只需要調(diào)用一次 fitpredict 就能夠在數(shù)據(jù)上擬合整個(gè)評估器序列,還可以使用柵格搜索一次遍歷全部參數(shù)。

Usage:
Pipeline 由一個(gè) (key, value) 列表構(gòu)建,key 是評估器對象 value 的名稱。

from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
from sklearn.decomposition import PCA

estimators = [('reduce_dim', PCA()), ('clf', SVC())]
pipe = Pipeline(estimators)
print(pipe)

Output:

Pipeline(memory=None, 
         steps=[('reduce_dim', PCA(copy=True, ...)),
                ('clf', SVC(C=1.0, ...)]

使用工具函數(shù) make_pipeline 更加便捷構(gòu)建 Pipeline,只用傳遞評估器對象,名稱將自動(dòng)生成。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容