sklearn聚類

數(shù)據(jù)的讀寫:

numpy讀寫數(shù)據(jù):

df=numpy.loadtxt("data.txt")

pandas讀寫:

df=pandas.read_csv("data.csv",encoding="utf-8")
df.pandas.to_csv("data.csv", index=False, encoding="utf-8")

#pandas讀寫文本文件
df=pandas.read_table("data.txt",delim_whitespace=True,encoding="utf-8")

2、聚類

1、使用sklearn做聚類很簡(jiǎn)單,下面我們使用k-means算法對(duì)二維數(shù)據(jù)進(jìn)行聚類

from sklearn.cluster import KMeans
from sklearn.externals import joblib
x=numpy.array(data) #data是一個(gè)二維list,也可以這樣得到:x=numpy.loadtxt("data.txt")
k=2
model=KMeans(n_clusters=k)
model.fit(x)
labels=model.labels_

2、對(duì)上面得到的聚類結(jié)果使用matplotlib庫可視化

A=numpy.array(filter(lambda x:x[2]==0, zip(x[:,0], x[:,1], labels))
A=numpy.array(map(lambda x:x[0:2], A)
B=numpy.array(filter(lambda x:x[2]==1, zip(x[:,0], x[:,1], labels))
B=numpy.array(map(lambda x:x[0:2], B)

plt.scatter(A[:,0],A[:,1], color="b")
plt.scatter(B[:,0],B[:,1], color="r")
plt.show()
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容