K-Means聚類算法
KMeans算法的基本思想是初始隨機給定K個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然后按平均法重新計算各個簇的質(zhì)心,從而確定新的簇心。一直迭代,直到簇心的移動距離小于某個給定的值。
K-Means聚類算法主要分為三個步驟:
第一步是為待聚類的點尋找聚類中心
第二步是計算每個點到聚類中心的距離,將每個點聚類到離該點最近的聚類中去
第三步是計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心
反復執(zhí)行(2)、(3),直到聚類中心不再進行大范圍移動或者聚類次數(shù)達到要求為止
下圖展示了對n個樣本點進行K-means聚類的效果,這里k取2:
- 未聚類的初始點集
- 隨機選取兩個點作為聚類中心
- 計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去
- 計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心
- 重復(c),計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去
- 重復(d),計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心