機(jī)器學(xué)習(xí)基本概念

1.基本概念:

訓(xùn)練集,測(cè)試集,特征值,監(jiān)督學(xué)習(xí),非監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí),分類(lèi),回歸

2.待學(xué)習(xí)的概念或目標(biāo)函數(shù)成為目標(biāo)概念,記做c

3. 例子:學(xué)習(xí) “享受運(yùn)動(dòng)" ?這一概念:


? ? ?小明進(jìn)行水上運(yùn)動(dòng),是否享受運(yùn)動(dòng)取決于很多因素



? ? ?天氣:晴,陰,雨

? ? ?溫度:暖,冷

? ? ?濕度:普通,大

? ? ?風(fēng)力:強(qiáng),弱

? ? ?水溫:暖,冷

? ? ?預(yù)報(bào):一樣,變化


? ? ?享受運(yùn)動(dòng):是,否

? ? ?概念定義在實(shí)例(instance)集合之上,這個(gè)集合表示為X。(X:所有可能的日子,每個(gè)日子的值由 天氣,溫度,濕度,風(fēng)力,水溫,預(yù) ? ? ? ? ?報(bào)6個(gè)屬性表示。

? ? ?待學(xué)習(xí)的概念或目標(biāo)函數(shù)成為目標(biāo)概念(target concept), 記做c。

? ? ?c(x) = 1, 當(dāng)享受運(yùn)動(dòng)時(shí),

?? ??c(x) = 0 當(dāng)不享受運(yùn)動(dòng)時(shí),c(x)也可叫做y

? ? ?x: 每一個(gè)實(shí)例

? ? ?X: 樣例, 所有實(shí)例的集合

? ? ?學(xué)習(xí)目標(biāo):f: X -> Y


4. 訓(xùn)練集(training set/data)/訓(xùn)練樣例(training examples): 用來(lái)進(jìn)行訓(xùn)練,也就是產(chǎn)生模型或者算法的數(shù)據(jù)集

? ? 測(cè)試集(testing set/data)/測(cè)試樣例 (testing examples):用來(lái)專門(mén)進(jìn)行測(cè)試已經(jīng)學(xué)習(xí)好的模型或者算法的數(shù)據(jù)集

特征向量(features/feature vector):屬性的集合,通常用一個(gè)向量來(lái)表示,附屬于一個(gè)實(shí)例(>標(biāo)題欄第一行)

標(biāo)記(label): c(x), 實(shí)例類(lèi)別的標(biāo)記>最后一欄的結(jié)果?是與否

? ? 正例(positive example)

? ? 反例(negative example)


5.

研究美國(guó)硅谷房?jī)r(jià)

? ? 影響房?jī)r(jià)的兩個(gè)重要因素:面積(平方米),學(xué)區(qū)(評(píng)分1-10)



6.

分類(lèi) (classification): 目標(biāo)標(biāo)記為類(lèi)別型數(shù)據(jù)(category)(>是與否)

回歸(regression): 目標(biāo)標(biāo)記為連續(xù)性數(shù)值 (continuous numeric value)(>數(shù)值)


7. 例子:研究腫瘤良性,惡性于尺寸,顏色的關(guān)系

特征值:腫瘤尺寸,顏色(>標(biāo)題欄第一行的屬性)

? ? ?標(biāo)記:良性/惡性??


有監(jiān)督學(xué)習(xí)(supervised?learning): 訓(xùn)練集有類(lèi)別標(biāo)記(class label)(>例子小明)

無(wú)監(jiān)督學(xué)習(xí)(unsupervised?learning): 無(wú)類(lèi)別標(biāo)記(class label)?(>例子:腫瘤)

? ? ?半監(jiān)督學(xué)習(xí)(semi-supervised learning):有類(lèi)別標(biāo)記的訓(xùn)練集 + 無(wú)標(biāo)記的訓(xùn)練集


8. 機(jī)器學(xué)習(xí)步驟框架

? ? ?8.1 把數(shù)據(jù)拆分為訓(xùn)練集和測(cè)試集

? ? ?8.2 用訓(xùn)練集和訓(xùn)練集的特征向量來(lái)訓(xùn)練算法

? ? ?8.2 用學(xué)習(xí)來(lái)的算法運(yùn)用在測(cè)試集上來(lái)評(píng)估算法 (可能要設(shè)計(jì)到調(diào)整參數(shù)(parameter tuning), 用驗(yàn)證集(validation set)

100 天: 訓(xùn)練集

10天:測(cè)試集 (不知道是否 ” 享受運(yùn)動(dòng)“, 知道6個(gè)屬性,來(lái)預(yù)測(cè)每一天是否享受運(yùn)動(dòng))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容