ML知識(shí)概括:

知識(shí)地圖.jpeg
ML常用公式

常用公式.jpeg
推薦學(xué)習(xí)博客:莫煩Python(有視頻和圖文,很大神非常推薦)
基本術(shù)語(yǔ)
- 特征向量(feature vector)/樣本(sample):用多個(gè)維度來(lái)描述一件事物有叫做“樣本”也叫做“特征向量”
- 訓(xùn)練(training):從數(shù)據(jù)中學(xué)得模型*得過(guò)程
- 訓(xùn)練樣本:訓(xùn)練過(guò)程中使用的數(shù)據(jù)稱(chēng)為“訓(xùn)練數(shù)據(jù)”,其中每個(gè)樣本稱(chēng)為一個(gè)“訓(xùn)練樣本”,訓(xùn)練樣本組成的集合稱(chēng)為“訓(xùn)練集”。
- 模型/學(xué)習(xí)器(learner):可看作學(xué)習(xí)算法在給定數(shù)據(jù)和參數(shù)空間上的實(shí)例化也叫做
- 標(biāo)記(label):關(guān)于樣本預(yù)測(cè)結(jié)果的信息,例如:“好瓜”、“壞瓜” 稱(chēng)為標(biāo)記,而,擁有了標(biāo)記信息的樣本稱(chēng)為樣例,一般的用(xi,yi)表示第i個(gè)樣例,xi為第i個(gè)特征向量,yi是xi的標(biāo)記。
- 分類(lèi)(classification)&回歸(regression):對(duì)于欲預(yù)測(cè)的是離散值,此類(lèi)學(xué)習(xí)任務(wù)稱(chēng)為“分類(lèi)”;若欲預(yù)測(cè)的是連續(xù)值,例如西瓜的成熟度0.95、0.37,此類(lèi)學(xué)習(xí)任務(wù)稱(chēng)為“回歸”
- 二分類(lèi)(binary classification)&多分類(lèi)(multi-class classification):對(duì)只涉及兩個(gè)類(lèi)別的的學(xué)習(xí)任務(wù)稱(chēng)為“二分類(lèi)”任務(wù),通常稱(chēng)為一個(gè)類(lèi)為“正類(lèi)”,另一個(gè)類(lèi)為“反類(lèi)”;涉及多個(gè)類(lèi)別時(shí),則稱(chēng)“多分類(lèi)”任務(wù)。
- 測(cè)試/評(píng)估(testing):學(xué)得模型后,使用其進(jìn)行預(yù)測(cè)的過(guò)程稱(chēng)為“測(cè)試”
- 聚類(lèi)(clustering):將訓(xùn)練集的樣本分成若干組,每一組稱(chēng)為一簇(cluster),這些自動(dòng)形成的簇可能對(duì)應(yīng)一些潛在的概念劃分,而且這樣的學(xué)習(xí)過(guò)程中使用的訓(xùn)練樣本通常不用于標(biāo)記信息。
- 監(jiān)督學(xué)習(xí)&無(wú)監(jiān)督學(xué)習(xí)
- 泛化(generalization) :學(xué)得模型適用于新樣本的能力,稱(chēng)為泛化能力