調(diào)包俠的機(jī)器學(xué)習(xí)神器—pycaret

在算法選型的時(shí)候經(jīng)常要把相關(guān)算法在數(shù)據(jù)集訓(xùn)練看一下效果,有時(shí)候想有空的時(shí)候一定要把這些工作封裝在一起,快速調(diào)用。

事實(shí)證明,只要拖的久,大牛們總會(huì)把讓人心儀的包封裝好。

本次重點(diǎn)推薦調(diào)包俠的機(jī)器學(xué)習(xí)神器—pycaret。

1、初始化

pycaret在初始化setup階段自動(dòng)完成機(jī)器學(xué)習(xí)必需的數(shù)據(jù)預(yù)處理步驟,例如缺失值插補(bǔ),分類變量編碼,標(biāo)簽編碼(將yes或no轉(zhuǎn)換為1或0)和訓(xùn)練、測試集拆分(train-test-split)

from pycaret.classification import setup
# 首先初始化,傳入數(shù)據(jù)集,Class variable為label信息
exp1 = setup(diabetes, target = 'Class variable')

例如diabetes這份數(shù)據(jù)集是二分類場景,數(shù)據(jù)結(jié)構(gòu)為(768,9),無缺失值情況,特征處理后有23個(gè)特征,拆分訓(xùn)練集

2、模型比較

# 一行代碼解決模型比較
from pycaret.classification import compare_models
compare_models()

比較這份數(shù)據(jù)集使用不同模型的效果

3、模型搭建與參數(shù)調(diào)優(yōu)

選擇最優(yōu)的算法訓(xùn)練數(shù)據(jù)集,并進(jìn)行參數(shù)調(diào)優(yōu)

from pycaret.classification import create_model, tune_model
# 模型搭建
adaboost = create_model('ada')
# 參數(shù)調(diào)優(yōu)
tuned_adaboost = tune_model('ada')

小結(jié)

其他內(nèi)容懶得寫了,總之就是pycaret可以用很少的代碼替換原來的數(shù)百行代碼,簡化工作量。

覺得有時(shí)間可以看一看源碼,看看特征工程、參數(shù)調(diào)優(yōu)等方面大牛們是怎么打造的

參考資料

[1] https://github.com/pycaret/pycaret
[2] 機(jī)器學(xué)習(xí)建模神器PyCaret已開源:https://blog.csdn.net/Datawhale/article/details/106009984

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容