手寫數(shù)字識別
#matplotlib畫圖包,sklearn傳統(tǒng)機器學(xué)習(xí)包
#In[5]:
import matplotlib.pyplot as plt
from sklearn import datasets, metrics
from sklearn.linear_model import LogisticRegression
讀取數(shù)據(jù)集
# In[9]:
#讀取數(shù)據(jù)集
digits = datasets.load_digits()
#打印樣例數(shù)據(jù)
samples = list(zip(digits.images, digits.target))
for id, (img, label) in enumerate(samples[:4]):
plt.subplot(2, 4, id + 1)
plt.axis('off')
plt.imshow(img, cmap = plt.cm.gray_r, interpolation = 'nearest')
plt.title('Label: %i' % label)
plt.show

樣例.png
# In[11]:
#有n個圖像
n = len(digits.images)
#將二維圖像變?yōu)橐痪S向量(n * 8 * 8 -> n * 64),方便處理
data = digits.images.reshape(n, -1)
建立模型
model = LogisticRegression(C = 1e5)
# In[17]:
#用前一半數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)
model.fit(data[:n//2], digits.target[:n//2])
# In[18]:
answer = digits.target[n//2:]
pred = model.predict(data[n//2:])
將預(yù)測結(jié)果與正確答案進(jìn)行比較
# In[19]:
#將預(yù)測結(jié)果與正確答案進(jìn)行比較
metrics.confusion_matrix(answer, pred)

QQ20180302-141209@2x預(yù)測結(jié)果.png
打印幾個預(yù)測的例子
# In[22]:
samples = list(zip(digits.images[n//2:], pred))
for id, (img, label) in enumerate(samples[:4]):
plt.subplot(2, 4, id + 1)
plt.axis('off')
plt.imshow(img, cmap = plt.cm.gray_r, interpolation = 'nearest')
plt.title('Predict: %i' % label)
plt.show()

預(yù)測例子.png