在互聯(lián)網(wǎng)早期,隨著網(wǎng)絡(luò)上的網(wǎng)頁逐漸增多,如何從海量網(wǎng)頁中檢索出我們想要的頁面,變得非常的重要。 當(dāng)時(shí)著名的雅虎和其它互聯(lián)網(wǎng)公司都試圖解決這個(gè)問題...
之前介紹到的一些機(jī)器學(xué)習(xí)算法都是監(jiān)督學(xué)習(xí)算法。所謂監(jiān)督學(xué)習(xí),就是既有特征數(shù)據(jù),又有目標(biāo)數(shù)據(jù)。 而本篇文章要介紹的K 均值算法是一種無監(jiān)督學(xué)習(xí)。 ...
上篇文章介紹了KNN 算法的原理[http://www.itdecent.cn/p/717abaf6954d],今天來介紹如何使用KNN 算法...
KNN 算法的全稱是K-Nearest Neighbor,中文為K 近鄰算法,它是基于距離的一種算法,簡單有效。 KNN 算法即可用于分類問題,...
在進(jìn)行數(shù)據(jù)分析的時(shí)候,經(jīng)常需要將數(shù)據(jù)進(jìn)行可視化,以方便我們對(duì)數(shù)據(jù)的認(rèn)識(shí)和理解。 0,Matplotlib 簡介 Matplotlib[https...
一般在機(jī)器學(xué)習(xí)的模型訓(xùn)練之前,有一個(gè)比較重要的步驟是數(shù)據(jù)變換。 因?yàn)?,一般情況下,原始數(shù)據(jù)的各個(gè)特征的值并不在一個(gè)統(tǒng)一的范圍內(nèi),這樣數(shù)據(jù)之間就沒...
生活中,我們經(jīng)常會(huì)對(duì)比兩個(gè)事物的相關(guān)性,也可以叫做相似度。 如果一件事物與另一件事物的相似度比較高,那這兩件事物的相關(guān)性就比較大。 如果一件事物...
上篇介紹了樸素貝葉斯的原理[http://www.itdecent.cn/p/2235cc3677b4],本篇來介紹如何用樸素貝葉斯解決實(shí)際問...
貝葉斯原理是英國數(shù)學(xué)家托馬斯·貝葉斯于18 世紀(jì)提出的,當(dāng)我們不能直接計(jì)算一件事情(A)發(fā)生的可能性大小的時(shí)候,可以間接的計(jì)算與這件事情有關(guān)的事...