K-means&PCA on handwritten digits

關(guān)鍵技術(shù)

  • PCA降維
  • K-means聚類
from time import time
import numpy as np
import matplotlib.pyplot as plt

from sklearn import metrics
from sklearn.cluster import KMeans
from sklearn.datasets import load_digits
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale

np.random.seed(7)

digits = load_digits()
data = scale(digits.data)
n_samples, n_features = data.shape
n_digits = len(np.unique(digits.target))
labels = digits.target
sample_size = 300

print("n_digits: %d, \t n_samples %d, \t n_features %d" % (n_digits, n_samples, n_features))

reduce_data = PCA(n_components=2).fit_transform(data)
kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10)
kmeans.fit(reduce_data)

plt.figure()
plt.clf()
colors = ['b', 'c', 'g', 'k', 'm', 'r', 'navy', 'y', 'darkorange', 'turquoise']
target_names = range(10)
centroids = kmeans.cluster_centers_
for (color, i, target_name) in zip(colors, target_names, target_names):
    plt.scatter(reduce_data[labels == i, 0], reduce_data[labels == i, 1], s=2, color=color, lw=2, label=target_name)
plt.legend(loc='best', shadow=False, scatterpoints=1)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='v', s=100, linewidths=3, color=colors, zorder=10)
plt.show()

使用sklearn庫發(fā)現(xiàn)非常簡單
結(jié)果如下


clustering_on_hw_digits.png

雖然沒有分的很開,但是相同數(shù)字還是聚合在一起的??梢允褂闷渌垲惙椒▽?shí)現(xiàn),效果會更好,后面介紹。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 無監(jiān)督學(xué)習(xí) 利用無標(biāo)簽的數(shù)據(jù)學(xué)習(xí)數(shù)據(jù)的分布或數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系被稱作無監(jiān)督學(xué)習(xí) 有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的最大區(qū)別...
    不做大哥好多年閱讀 4,729評論 0 9
  • 很多機(jī)器學(xué)習(xí)的問題都會涉及到有著幾千甚至數(shù)百萬維的特征的訓(xùn)練實(shí)例。這不僅讓訓(xùn)練過程變得非常緩慢,同時還很難找到一個...
    城市中迷途小書童閱讀 4,057評論 0 2
  • 一、PCA 【Principle Component Analysis】 以下內(nèi)容大部分出自這里,這里。主成分分...
    喔蕾喔蕾喔蕾蕾蕾閱讀 3,289評論 0 5
  • 原來的云不躲風(fēng)雨, 原來的火不識紅曲。 原來的你不曾哭泣, 原來的我不懂別離。 我走在喧鬧的街頭, 穿過人群, 望...
    徐達(dá)開閱讀 242評論 2 5
  • 通過聽王菲老師《網(wǎng)絡(luò)助我成長》的課,我受益匪淺。王老師在鄉(xiāng)村從教十多年,從應(yīng)試教育到素質(zhì)教育再到網(wǎng)絡(luò)教育,讓...
    松陽310葉揚(yáng)舟閱讀 159評論 0 0

友情鏈接更多精彩內(nèi)容