深度學(xué)習(xí) (DeepLearning) 基礎(chǔ) [1]---監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)
Introduce
學(xué)習(xí)了Pytorch基礎(chǔ)之后,在利用Pytorch搭建各種神經(jīng)網(wǎng)絡(luò)模型解決問題之前,我們需要了解深度學(xué)習(xí)的一些基礎(chǔ)知識。本文主要介紹監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
以下均為個人學(xué)習(xí)筆記,若有錯誤望指出。
監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)
常見的機器學(xué)習(xí)方法的類型如下:
- 監(jiān)督學(xué)習(xí):用已知標(biāo)簽的訓(xùn)練樣本訓(xùn)練模型,用來預(yù)測未來輸入樣本的標(biāo)簽,如用于邏輯回歸分類器。
- 無監(jiān)督學(xué)習(xí):不需要有已知標(biāo)簽的訓(xùn)練樣本,而是直接對數(shù)據(jù)建模,如Kmeans等模型。
- 半監(jiān)督學(xué)習(xí):在訓(xùn)練階段使用的訓(xùn)練樣本集中只有少量已知標(biāo)簽的樣本,而存在大量未標(biāo)記的樣本。
- 強化學(xué)習(xí):通過設(shè)定一個回報函數(shù) (reward function) 來反映我們最終的學(xué)習(xí)目標(biāo)(比如我們希望訓(xùn)練模型的...更符合我們預(yù)期的目標(biāo)),其次再通過不斷訓(xùn)練得到一個逐步逼近我們訓(xùn)練目標(biāo)(使得我們設(shè)定的回報函數(shù)最大)的模型。