你可能不知道,機(jī)器學(xué)習(xí)的核心竟然是學(xué)會(huì)忘記

很多人并不知道,機(jī)器學(xué)習(xí)的核心竟然是教會(huì)機(jī)器學(xué)會(huì)忘記。

你沒看錯(cuò),就是“忘記”。

人之所以智能,是因?yàn)槲覀冇幸环N能力,只記住需要記住的東西,有些不重要的特征,會(huì)自然選擇遺忘。

我舉個(gè)栗子

看下面兩張圖

你一眼就能看出來,這是同一個(gè)人,江疏影。

我們會(huì)自動(dòng)忽略發(fā)型/眼神/耳環(huán)/衣物/角度等不重要的區(qū)別,換句話說,在我們的腦海中,我們只是比較了這兩個(gè)圖片的“重要特征”。

可是,讓機(jī)器認(rèn)為這是同一個(gè)人,并不是很容易的事兒。

“精確”,是計(jì)算機(jī)天生的屬性,它們會(huì)精確的記住每一個(gè)信息細(xì)節(jié),讓機(jī)器來認(rèn)定“相同”,除非在每一個(gè)信息上,每一個(gè)比特,全部都相等才可以。

要想使它們“忘記”一些不重要的特性,很難。

那是以前

現(xiàn)在有了神經(jīng)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)會(huì)自動(dòng)忽略細(xì)節(jié),捕捉重要特征,完全模擬人類的模式來進(jìn)行圖片識別。

補(bǔ)充兩個(gè)概念吧。

對于一些細(xì)節(jié),如果我們的算法關(guān)注過頭了,叫做“過擬合”,這種情況下,需要讓算法進(jìn)行“忘記”,過擬合是機(jī)器的天然屬性,算法的調(diào)優(yōu),在很多時(shí)候是消除過擬合。這個(gè)并不容易,有很多機(jī)器學(xué)習(xí)的例子都是給定已經(jīng)清理好的數(shù)據(jù),但是,數(shù)據(jù)的清理,消除噪聲,才是消除過擬合的最重要的一步。

有過擬合,就有欠擬合,那就是細(xì)節(jié)關(guān)注不夠嘍。

下面三個(gè)圖是同樣的數(shù)據(jù),分別代表欠擬合/正合適/過擬合

一個(gè)過擬合的算法會(huì)把“江疏影” 和 “略微變換的江疏影” (姿勢/發(fā)型稍有變化)

認(rèn)為不是同一個(gè)人,而一個(gè)欠擬合的算法會(huì)把“江疏影”和“馬士兵”認(rèn)定為同一個(gè)人

那么問題就來了,剛才我講過了“過擬合”產(chǎn)生的原因,那么:

1:“欠擬合”會(huì)在什么情況下產(chǎn)生呢?

2:一個(gè)中國游客吐了口痰,我們就說“中國人素質(zhì)差”,這是犯了過擬合的錯(cuò)誤還是欠擬合的錯(cuò)誤呢?

3:白羊座容易過擬合還是欠擬合?

4:處女座容易過擬合還是欠擬合?

留言吧。

需要神經(jīng)網(wǎng)絡(luò)視頻資料,進(jìn)群可以尋找哦


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容