什么是監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、弱監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、多示例學(xué)習(xí)?
隨著機(jī)器學(xué)習(xí)問題不斷深入人心,人們也將現(xiàn)實(shí)中遇到不同的問題分為不同的學(xué)習(xí)方式,其中,最基礎(chǔ)的應(yīng)屬監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)了。
監(jiān)督學(xué)習(xí)(supervised learning):已知數(shù)據(jù)和其一一對(duì)應(yīng)的標(biāo)簽,訓(xùn)練一個(gè)智能算法,將輸入數(shù)據(jù)映射到標(biāo)簽的過程。監(jiān)督學(xué)習(xí)是最常見的學(xué)習(xí)問題之一,就是人們口中常說的分類問題。比如已知一些圖片是豬,一些圖片不是豬,那么訓(xùn)練一個(gè)算法,當(dāng)一個(gè)新的圖片輸入算法的時(shí)候算法告訴我們這張圖片是不是豬。
無監(jiān)督學(xué)習(xí)(unsupervised learning):已知數(shù)據(jù)不知道任何標(biāo)簽,按照一定的偏好,訓(xùn)練一個(gè)智能算法,將所有的數(shù)據(jù)映射到多個(gè)不同標(biāo)簽的過程。相對(duì)于有監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)是一類比較困難的問題,所謂的按照一定的偏好,是比如特征空間距離最近,等人們認(rèn)為屬于一類的事物應(yīng)具有的一些特點(diǎn)。舉個(gè)例子,豬和鴕鳥混雜在一起,算法會(huì)測(cè)量高度,發(fā)現(xiàn)動(dòng)物們主要集中在兩個(gè)高度,一類動(dòng)物身高一米左右,另一類動(dòng)物身高半米左右,那么算法按照就近原則,75厘米以上的就是高的那類也就是鴕鳥,矮的那類是第二類也就是豬,當(dāng)然這里也會(huì)出現(xiàn)身材矮小的鴕鳥和身高爆表的豬會(huì)被錯(cuò)誤的分類。
強(qiáng)化學(xué)習(xí)(reinforcement learning):智能算法在沒有人為指導(dǎo)的情況下,通過不斷的試錯(cuò)來提升任務(wù)性能的過程?!霸囧e(cuò)”的意思是還是有一個(gè)衡量標(biāo)準(zhǔn),用棋類游戲舉例,我們并不知道棋手下一步棋是對(duì)是錯(cuò),不知道哪步棋是制勝的關(guān)鍵,但是我們知道結(jié)果是輸還是贏,如果算法這樣走最后的結(jié)果是勝利,那么算法就學(xué)習(xí)記憶,如果按照那樣走最后輸了,那么算法就學(xué)習(xí)以后不這樣走。
弱監(jiān)督學(xué)習(xí)(weakly supervised learning): 已知數(shù)據(jù)和其一一對(duì)應(yīng)的弱標(biāo)簽,訓(xùn)練一個(gè)智能算法,將輸入數(shù)據(jù)映射到一組更強(qiáng)的標(biāo)簽的過程。標(biāo)簽的強(qiáng)弱指的是標(biāo)簽蘊(yùn)含的信息量的多少,比如相對(duì)于分割的標(biāo)簽來說,分類的標(biāo)簽就是弱標(biāo)簽,如果我們知道一幅圖,告訴你圖上有一只豬,然后需要你把豬在哪里,豬和背景的分界在哪里找出來,那么這就是一個(gè)已知若標(biāo)簽,去學(xué)習(xí)強(qiáng)標(biāo)簽的弱監(jiān)督學(xué)習(xí)問題。
半監(jiān)督學(xué)習(xí)(semi supervised learning):已知數(shù)據(jù)和部分?jǐn)?shù)據(jù)一一對(duì)應(yīng)的標(biāo)簽,有一部分?jǐn)?shù)據(jù)的標(biāo)簽未知,訓(xùn)練一個(gè)智能算法,學(xué)習(xí)已知標(biāo)簽和未知標(biāo)簽的數(shù)據(jù),將輸入數(shù)據(jù)映射到標(biāo)簽的過程。半監(jiān)督通常是一個(gè)數(shù)據(jù)的標(biāo)注非常困難,比如說醫(yī)院的檢查結(jié)果,醫(yī)生也需要一段時(shí)間來判斷健康與否,可能只有幾組數(shù)據(jù)知道是健康還是非健康,其他的只有數(shù)據(jù)不知道是不是健康。那么通過有監(jiān)督學(xué)習(xí)和無監(jiān)督的結(jié)合的半監(jiān)督學(xué)習(xí)就在這里發(fā)揮作用了。
多示例學(xué)習(xí)(multiple instance learning):已知包含多個(gè)數(shù)據(jù)的數(shù)據(jù)包和數(shù)據(jù)包的標(biāo)簽,訓(xùn)練智能算法,將數(shù)據(jù)包映射到標(biāo)簽的過程,在有的問題中也同時(shí)給出包內(nèi)每個(gè)數(shù)據(jù)的標(biāo)簽。多事例學(xué)習(xí)引入了數(shù)據(jù)包的概念,比如說一段視頻由很多張圖組成,假如1000張,那么我們要判斷視頻里是否有豬出現(xiàn),一張一張的標(biāo)注每一幀是否有豬太耗時(shí),所以人們看一遍說這個(gè)視頻里有豬或者沒豬,那么就得到了多示例學(xué)習(xí)的數(shù)據(jù),1000幀的數(shù)據(jù)不是每一個(gè)都有豬出現(xiàn),只要有一幀有豬,那么我們就認(rèn)為這個(gè)包是有豬的,所有的都沒有豬,才是沒有豬的,從這里面學(xué)習(xí)哪一段視頻(1000張)有豬哪一段視頻沒有就是多事例學(xué)習(xí)的問題。