主要介紹scikit-learn中的模型的保存與加載
我們訓(xùn)練好了一個(gè)Model 以后總需要保存和再次預(yù)測(cè), 所以保存和讀取我們的sklearn model也是同樣重要的一步。這次主要介紹兩種保存Model的模塊pickle與joblib。
Demo.py
import pickle
from sklearn.externals import joblib
from sklearn.svm import SVC
from sklearn import datasets
# 定義分類(lèi)器
svm = SVC()
# 加載iris數(shù)據(jù)集
iris = datasets.load_iris()
# 讀取特征
X = iris.data
# 讀取分類(lèi)標(biāo)簽
y = iris.target
# 訓(xùn)練模型
svm.fit(X, y)
# 第一種:保存成python支持的文件格式pickle, 在當(dāng)前目錄下可以看到svm.pickle
with open('svm.pickle', 'wb') as fw:
pickle.dump(svm, fw)
# 加載svm.pickle
with open('svm.pickle', 'rb') as fr:
new_svm = pickle.load(fr)
print (new_svm.predict(X[0:1]))
# 第二種:保存成sklearn自帶的文件格式
joblib.dump(svm, 'svm.pkl')
# 加載svm.pkl
new_svm = joblib.load('svm.pkl')
print (new_svm.predict(X[0:1]))
結(jié)果:
[0] #第一種保存方式產(chǎn)生結(jié)果
[0] #第二種保存方式產(chǎn)生結(jié)果
最后可以知道joblib在使用上比較容易,讀取速度也相對(duì)pickle快。