機(jī)器學(xué)習(xí)(ML) 入門(mén)知識(shí)

ML知識(shí)概括:

知識(shí)地圖.jpeg

ML常用公式

常用公式.jpeg

推薦學(xué)習(xí)博客:莫煩Python(有視頻和圖文,很大神非常推薦)

https://morvanzhou.github.io/

基本術(shù)語(yǔ)

  • 特征向量(feature vector)/樣本(sample):用多個(gè)維度來(lái)描述一件事物有叫做“樣本”也叫做“特征向量”
  • 訓(xùn)練(training):從數(shù)據(jù)中學(xué)得模型*得過(guò)程
  • 訓(xùn)練樣本:訓(xùn)練過(guò)程中使用的數(shù)據(jù)稱(chēng)為“訓(xùn)練數(shù)據(jù)”,其中每個(gè)樣本稱(chēng)為一個(gè)“訓(xùn)練樣本”,訓(xùn)練樣本組成的集合稱(chēng)為“訓(xùn)練集”。
  • 模型/學(xué)習(xí)器(learner):可看作學(xué)習(xí)算法在給定數(shù)據(jù)和參數(shù)空間上的實(shí)例化也叫做
  • 標(biāo)記(label):關(guān)于樣本預(yù)測(cè)結(jié)果的信息,例如:“好瓜”、“壞瓜” 稱(chēng)為標(biāo)記,而,擁有了標(biāo)記信息的樣本稱(chēng)為樣例,一般的用(xi,yi)表示第i個(gè)樣例,xi為第i個(gè)特征向量,yi是xi的標(biāo)記。
  • 分類(lèi)(classification)&回歸(regression):對(duì)于欲預(yù)測(cè)的是離散值,此類(lèi)學(xué)習(xí)任務(wù)稱(chēng)為“分類(lèi)”;若欲預(yù)測(cè)的是連續(xù)值,例如西瓜的成熟度0.95、0.37,此類(lèi)學(xué)習(xí)任務(wù)稱(chēng)為“回歸”
  • 二分類(lèi)(binary classification)&多分類(lèi)(multi-class classification):對(duì)只涉及兩個(gè)類(lèi)別的的學(xué)習(xí)任務(wù)稱(chēng)為“二分類(lèi)”任務(wù),通常稱(chēng)為一個(gè)類(lèi)為“正類(lèi)”,另一個(gè)類(lèi)為“反類(lèi)”;涉及多個(gè)類(lèi)別時(shí),則稱(chēng)“多分類(lèi)”任務(wù)。
  • 測(cè)試/評(píng)估(testing):學(xué)得模型后,使用其進(jìn)行預(yù)測(cè)的過(guò)程稱(chēng)為“測(cè)試”
  • 聚類(lèi)(clustering):將訓(xùn)練集的樣本分成若干組,每一組稱(chēng)為一簇(cluster),這些自動(dòng)形成的簇可能對(duì)應(yīng)一些潛在的概念劃分,而且這樣的學(xué)習(xí)過(guò)程中使用的訓(xùn)練樣本通常不用于標(biāo)記信息。
  • 監(jiān)督學(xué)習(xí)&無(wú)監(jiān)督學(xué)習(xí)
  • 泛化(generalization) :學(xué)得模型適用于新樣本的能力,稱(chēng)為泛化能力

假設(shè)空間

scikit-learn 中文文檔

http://sklearn.apachecn.org/cn/0.19.0/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容