很多人并不知道,機(jī)器學(xué)習(xí)的核心竟然是教會(huì)機(jī)器學(xué)會(huì)忘記。
你沒看錯(cuò),就是“忘記”。
人之所以智能,是因?yàn)槲覀冇幸环N能力,只記住需要記住的東西,有些不重要的特征,會(huì)自然選擇遺忘。
我舉個(gè)栗子
看下面兩張圖
你一眼就能看出來,這是同一個(gè)人,江疏影。
我們會(huì)自動(dòng)忽略發(fā)型/眼神/耳環(huán)/衣物/角度等不重要的區(qū)別,換句話說,在我們的腦海中,我們只是比較了這兩個(gè)圖片的“重要特征”。
可是,讓機(jī)器認(rèn)為這是同一個(gè)人,并不是很容易的事兒。
“精確”,是計(jì)算機(jī)天生的屬性,它們會(huì)精確的記住每一個(gè)信息細(xì)節(jié),讓機(jī)器來認(rèn)定“相同”,除非在每一個(gè)信息上,每一個(gè)比特,全部都相等才可以。
要想使它們“忘記”一些不重要的特性,很難。
那是以前
現(xiàn)在有了神經(jīng)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)會(huì)自動(dòng)忽略細(xì)節(jié),捕捉重要特征,完全模擬人類的模式來進(jìn)行圖片識別。
補(bǔ)充兩個(gè)概念吧。
對于一些細(xì)節(jié),如果我們的算法關(guān)注過頭了,叫做“過擬合”,這種情況下,需要讓算法進(jìn)行“忘記”,過擬合是機(jī)器的天然屬性,算法的調(diào)優(yōu),在很多時(shí)候是消除過擬合。這個(gè)并不容易,有很多機(jī)器學(xué)習(xí)的例子都是給定已經(jīng)清理好的數(shù)據(jù),但是,數(shù)據(jù)的清理,消除噪聲,才是消除過擬合的最重要的一步。
有過擬合,就有欠擬合,那就是細(xì)節(jié)關(guān)注不夠嘍。
下面三個(gè)圖是同樣的數(shù)據(jù),分別代表欠擬合/正合適/過擬合
一個(gè)過擬合的算法會(huì)把“江疏影” 和 “略微變換的江疏影” (姿勢/發(fā)型稍有變化)
認(rèn)為不是同一個(gè)人,而一個(gè)欠擬合的算法會(huì)把“江疏影”和“馬士兵”認(rèn)定為同一個(gè)人
那么問題就來了,剛才我講過了“過擬合”產(chǎn)生的原因,那么:
1:“欠擬合”會(huì)在什么情況下產(chǎn)生呢?
2:一個(gè)中國游客吐了口痰,我們就說“中國人素質(zhì)差”,這是犯了過擬合的錯(cuò)誤還是欠擬合的錯(cuò)誤呢?
3:白羊座容易過擬合還是欠擬合?
4:處女座容易過擬合還是欠擬合?
留言吧。
需要神經(jīng)網(wǎng)絡(luò)視頻資料,進(jìn)群可以尋找哦
