李宏毅深度學(xué)習(xí)筆記1 - 深度學(xué)習(xí)入門(mén)

在談到深度學(xué)習(xí)之前,我們都會(huì)提機(jī)器學(xué)習(xí),因?yàn)樯疃葘W(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支。那么什么時(shí)機(jī)器學(xué)習(xí)呢?
簡(jiǎn)單來(lái)說(shuō)機(jī)器學(xué)習(xí)是一種算法,是一種通過(guò)數(shù)據(jù)來(lái)解決問(wèn)題的方法。解決什么問(wèn)題?最常用的有兩類(lèi)問(wèn)題:

  • 分類(lèi): 通過(guò)病人的病理報(bào)告等數(shù)據(jù)判斷是否患病
  • 回歸: 通過(guò)歷史交易數(shù)據(jù)判斷期貨行情走勢(shì)
    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)都是通過(guò)大量的(歷史)數(shù)據(jù)來(lái)尋找一個(gè)模型,或者叫函數(shù),或者映射也可以,他可以完成從問(wèn)題到答案的推理過(guò)程。而判斷這個(gè)模型的好壞就是這個(gè)答案靠不靠譜。

兩者的共同點(diǎn)都是通過(guò)數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí),可以這么說(shuō),深度學(xué)習(xí)是目前為止最接近人工智能的途徑。深度學(xué)習(xí)通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)數(shù)據(jù)中暗含的規(guī)律進(jìn)而來(lái)預(yù)測(cè)或者分類(lèi)。

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的不同之處:
傳統(tǒng)的機(jī)器學(xué)習(xí)如隨機(jī)森林、SVM、等都是和統(tǒng)計(jì)學(xué)相關(guān)。使用數(shù)理統(tǒng)計(jì)的方法來(lái)建立模型。通常情況為了獲得比較好的模型精度,需要人工設(shè)計(jì)大量的特征(基于基本的統(tǒng)計(jì)原理)來(lái)讓模型更好的去逼近實(shí)際情況。而深度學(xué)習(xí)通過(guò)人工設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)來(lái)捕獲數(shù)據(jù)中的規(guī)律,不在需要去設(shè)計(jì)復(fù)雜的特征了。
從傳統(tǒng)的機(jī)器學(xué)習(xí)到深度學(xué)習(xí),算法工程師的工作重點(diǎn)從設(shè)計(jì)特征過(guò)渡到了設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu),例如什么樣的網(wǎng)絡(luò)結(jié)構(gòu)適合從圖像中提取特征,什么樣的網(wǎng)絡(luò)結(jié)構(gòu)適合識(shí)別語(yǔ)音等。
同時(shí),從從傳統(tǒng)的機(jī)器學(xué)習(xí)到深度學(xué)習(xí),人們研究的對(duì)象也從基本的數(shù)值型數(shù)據(jù)擴(kuò)展到了維度更高的張量(例如圖像、語(yǔ)音等)??梢赃@么正式圖像領(lǐng)域的大量新的應(yīng)用(如人臉識(shí)別,瑕疵檢測(cè)等)推動(dòng)了深度學(xué)習(xí)的發(fā)展。深度學(xué)習(xí)技術(shù)也因?yàn)樵谶@些領(lǐng)域獲得了遠(yuǎn)超傳統(tǒng)技術(shù)的成績(jī),讓越來(lái)越的科學(xué)家和工程師參與,讓深度學(xué)習(xí)成為當(dāng)今AI的代名詞。

深度學(xué)習(xí)解決問(wèn)題的一般步驟:
對(duì)于任何一個(gè)深度學(xué)習(xí)模型,我們都可以從三個(gè)方面來(lái)進(jìn)行解剖,即:

    1. 模型(Model)
      機(jī)器學(xué)習(xí)問(wèn)題通常都要都要轉(zhuǎn)化為一個(gè)數(shù)學(xué)模型來(lái)求解。模型是從數(shù)據(jù)里抽象出來(lái)的。在進(jìn)行數(shù)據(jù)分析時(shí),我們通常手上只有數(shù)據(jù),從數(shù)據(jù)中抽取的規(guī)律就是模型。一般情況,該模型表達(dá)了從特征到標(biāo)簽(數(shù)值)的映射關(guān)系。給定一個(gè)輸入,經(jīng)過(guò)模型后就可以得到一個(gè)輸出。模型可以是確定性的,也可以是隨機(jī)的,無(wú)所謂,總之用數(shù)學(xué)可以描述,只要數(shù)學(xué)可以描述的,就可以進(jìn)行預(yù)測(cè)分析。從這點(diǎn)上來(lái)說(shuō),機(jī)器學(xué)習(xí),就是讓機(jī)器通過(guò)數(shù)據(jù)產(chǎn)生模型。
    1. 策略(Strategy)
      知道了模型的概念,那么如何通過(guò)數(shù)據(jù)來(lái)構(gòu)造模型呢? 如何構(gòu)造就是我們所謂的策略。
      不同的策略,對(duì)應(yīng)不同的模型的比較標(biāo)準(zhǔn)和選擇標(biāo)準(zhǔn)。就跟選班干部一樣,選帥的,好,那就讓吳彥祖當(dāng)班長(zhǎng),選逗比的,也許選出來(lái)的就是王寶強(qiáng),選會(huì)唱歌的,沒(méi)準(zhǔn)是周杰倫…好,所以最終確定的模型是什么,實(shí)際上就跟兩件事兒有關(guān):
    • 我們拿到的數(shù)據(jù)是什么?
    • 我們選擇模型的策略是什么?

說(shuō)道策略,一般會(huì)講到,經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化作為常用的標(biāo)準(zhǔn)。經(jīng)驗(yàn)風(fēng)險(xiǎn)最小是指,用這個(gè)模型,套到已有的觀(guān)測(cè)數(shù)據(jù)上,基本上是靠譜的。這也是大多數(shù)時(shí)候我們?cè)跈C(jī)器學(xué)習(xí)時(shí)候有意或無(wú)意就用到的準(zhǔn)側(cè)。經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化是一個(gè)參數(shù)優(yōu)化的過(guò)程,我們需要構(gòu)造一個(gè)損失函數(shù)來(lái)描述經(jīng)驗(yàn)風(fēng)險(xiǎn),損失函數(shù)可以理解為我們預(yù)測(cè)一個(gè)數(shù)據(jù)錯(cuò)了給我們帶來(lái)的代價(jià)。每個(gè)人對(duì)損失函數(shù)的定義都不同,所以?xún)?yōu)化出來(lái)的結(jié)果也不同,這也導(dǎo)致最終我們學(xué)習(xí)到的模型會(huì)各種各樣,解決一個(gè)問(wèn)題的方案有多種多樣…

  • 3 算法(Algorithm)

我們通過(guò)策略實(shí)現(xiàn)模型的方法就是算法
我們有了數(shù)據(jù),有了學(xué)習(xí)模型的策略,然后就要開(kāi)始去構(gòu)造模型了,如果模型的基本形式有了,就是一個(gè)優(yōu)化模型參數(shù)的問(wèn)題了。如果學(xué)習(xí)過(guò)確定性模型的朋友,優(yōu)化并不陌生,但是優(yōu)化過(guò)程往往是復(fù)雜的,面對(duì)復(fù)雜的數(shù)學(xué)優(yōu)化問(wèn)題我們通常難以通過(guò)簡(jiǎn)單的求導(dǎo)獲得最終的結(jié)果,所以就要構(gòu)造一系列的算法。

這三個(gè)套路在所有的深度學(xué)習(xí)項(xiàng)目中都是成立,可以完全套用。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容