k 均值聚類算法的工作流程是這樣的:首先選取 k 個(gè)點(diǎn),作為初始 k 個(gè)簇的中心(這個(gè) k 是人為設(shè)定的超參數(shù)),然后將其余的數(shù)據(jù)對(duì)象分配到距離...
俗語(yǔ)有云:“人以群分,物以類聚”。簡(jiǎn)單來說,聚類指的是將物理或抽象對(duì)象集合分成由相似對(duì)象組成的多個(gè)類的過程。從這個(gè)簡(jiǎn)單的描述中可以看出,聚類的關(guān)...
我們知道,深度學(xué)習(xí)網(wǎng)絡(luò)是目前非常熱門的研究議題。但在本質(zhì)上,深度學(xué)習(xí)網(wǎng)絡(luò)就是層數(shù)較多的神經(jīng)網(wǎng)絡(luò)。雖然 sklearn 并不支持深度學(xué)習(xí),但久經(jīng)時(shí)...
聚類操作得有數(shù)據(jù)才行,這里我們先用 sklearn 的數(shù)據(jù)生成工具 make_blobs( ) 來合成所需的數(shù)據(jù)。make_blobs( ) 方...
在掌握 Logistic 回歸的基本原理之后,下面我們通過實(shí)戰(zhàn)來感受一下這個(gè)模型。由于模型的求解過程(如梯度下降法、牛頓法)和正則化流程都被封裝...
本節(jié)教程我們來討論另外一種被廣泛應(yīng)用的分類算法— Logistic 回歸。在講解這個(gè)概念之前,我們先來聊一個(gè)題外話—“Logistic regr...
如何自學(xué)成長(zhǎng)入門階段目標(biāo)一:會(huì)用數(shù)據(jù)分析的方式解決一些簡(jiǎn)單的業(yè)務(wù)問題1.通讀《深入淺出數(shù)據(jù)分析》 所有問題一開始都會(huì)有實(shí)際業(yè)務(wù)場(chǎng)景的引入 然后會(huì)...
k 均值聚類算法的優(yōu)點(diǎn)很明顯,那就是原理簡(jiǎn)單、易于操作,并且執(zhí)行效率非常高,因此該算法得到了廣泛的應(yīng)用。但它也有不足,大體上有以下四點(diǎn)。 1) ...
本教程中的 k-近鄰算法實(shí)戰(zhàn),使用的數(shù)據(jù)集是非常經(jīng)典的鳶尾花數(shù)據(jù)集。該數(shù)據(jù)集最初是由美國(guó)植物學(xué)家埃德加·安德森(Edgar Anderson)整...