Pytorch_第五篇_深度學(xué)習(xí) (DeepLearning) 基礎(chǔ) [1]---監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)

深度學(xué)習(xí) (DeepLearning) 基礎(chǔ) [1]---監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)


Introduce

學(xué)習(xí)了Pytorch基礎(chǔ)之后,在利用Pytorch搭建各種神經(jīng)網(wǎng)絡(luò)模型解決問題之前,我們需要了解深度學(xué)習(xí)的一些基礎(chǔ)知識。本文主要介紹監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。

以下均為個人學(xué)習(xí)筆記,若有錯誤望指出。


監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)

常見的機器學(xué)習(xí)方法的類型如下:

  • 監(jiān)督學(xué)習(xí):用已知標(biāo)簽的訓(xùn)練樣本訓(xùn)練模型,用來預(yù)測未來輸入樣本的標(biāo)簽,如用于邏輯回歸分類器。
  • 無監(jiān)督學(xué)習(xí):不需要有已知標(biāo)簽的訓(xùn)練樣本,而是直接對數(shù)據(jù)建模,如Kmeans等模型。
  • 半監(jiān)督學(xué)習(xí):在訓(xùn)練階段使用的訓(xùn)練樣本集中只有少量已知標(biāo)簽的樣本,而存在大量未標(biāo)記的樣本。
  • 強化學(xué)習(xí):通過設(shè)定一個回報函數(shù) (reward function) 來反映我們最終的學(xué)習(xí)目標(biāo)(比如我們希望訓(xùn)練模型的...更符合我們預(yù)期的目標(biāo)),其次再通過不斷訓(xùn)練得到一個逐步逼近我們訓(xùn)練目標(biāo)(使得我們設(shè)定的回報函數(shù)最大)的模型。

本文參考-1

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容