九月中下旬 好像并沒有那么順心 很多東西積壓著思緒無從下手 很久沒有冒痘 也冒痘了 生理和心理雙重奏 希望接下來順利一點(diǎn)吧!今天就記錄一下 小樣本學(xué)習(xí)中的元學(xué)習(xí)。
元學(xué)習(xí)
什么是元學(xué)習(xí)?
元學(xué)習(xí)即Meta-Learnig,它希望模型獲取一種“學(xué)會(huì)學(xué)習(xí)”的能力,使其可以在獲取已有“知識(shí)”的基礎(chǔ)上快速學(xué)習(xí)新的任務(wù),它的意圖在于通過少量的訓(xùn)練實(shí)例設(shè)計(jì)能夠快速學(xué)習(xí)新技能或適應(yīng)新環(huán)境的模型。
一個(gè)通俗易懂的區(qū)分:與機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)和元學(xué)習(xí)實(shí)際上目的都是找一個(gè)Function,只是兩個(gè)Function的功能不同,要做的事情不一樣。機(jī)器學(xué)習(xí)中的Function直接作用于特征和標(biāo)簽,去尋找特征與標(biāo)簽之間的關(guān)聯(lián);而元學(xué)習(xí)中的Function是用于尋找新的f,新的f才會(huì)應(yīng)用于具體的任務(wù)。
也可這樣理解:機(jī)器學(xué)習(xí)學(xué)習(xí)某個(gè)數(shù)據(jù)分布X到另一個(gè)分布Y的映射。 而元學(xué)習(xí)學(xué)習(xí)的是某個(gè)任務(wù)集合D到每個(gè)任務(wù)對(duì)應(yīng)的最優(yōu)函數(shù)f的映射(任務(wù)到學(xué)習(xí)函數(shù)的映射)
數(shù)據(jù)層面的不同:
機(jī)器學(xué)習(xí)中,通過大量的數(shù)據(jù)對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,數(shù)據(jù)主要有訓(xùn)練集、測(cè)試集和驗(yàn)證集。在元學(xué)習(xí)中,訓(xùn)練單位分層級(jí)了,第一層訓(xùn)練單位是任務(wù),也就是說,元學(xué)習(xí)中要準(zhǔn)備許多任務(wù)來進(jìn)行學(xué)習(xí),第二層訓(xùn)練單位才是每個(gè)任務(wù)對(duì)應(yīng)的數(shù)據(jù)。(訓(xùn)練樣本中的訓(xùn)練集一般稱作support set,訓(xùn)練樣本中的測(cè)試集一般叫做query set)[
與遷移學(xué)習(xí):
元學(xué)習(xí)更偏重于任何和數(shù)據(jù)的雙重采樣, 任務(wù)和數(shù)據(jù)一樣是需要采樣的,而學(xué)習(xí)到的F(x)可以幫助在未見過的任務(wù)f(x)里迅速建立mapping。 而遷移學(xué)習(xí)更多是指從一個(gè)任務(wù)到其它任務(wù)的能力遷移,不太強(qiáng)調(diào)任務(wù)空間的概念舉個(gè)栗子:
根據(jù)上圖,我們先定義一下解決的問題:我們?cè)谝慌?xùn)練任務(wù){(diào)Ti}上訓(xùn)練元學(xué)習(xí)算法,算法在被訓(xùn)練解決這些任務(wù)的過程中得到的經(jīng)驗(yàn)將被用于解決最終的任務(wù)T。
那么在圖中,我們希望用已標(biāo)記的狗的品種的圖片(support set)來識(shí)別新的圖片(品種)中的狗(query set)。訓(xùn)練任務(wù){(diào)Ti}中的某一項(xiàng)任務(wù)Ti可以是通過使用3x2=6的已標(biāo)記的同品種狗圖片中獲取信息,將新圖片標(biāo)記。
元學(xué)習(xí)過程就是由一系列這樣的每一次針對(duì)不同品種的狗的訓(xùn)練任務(wù)Ti所組成的。我們希望元學(xué)習(xí)模型“隨著經(jīng)驗(yàn)和任務(wù)數(shù)量的增長”得到不斷地改進(jìn)。最終,我們?cè)赥任務(wù)上評(píng)估模型。
參考:元學(xué)習(xí)初探綜述數(shù)學(xué)上的定義:
一個(gè)好的元學(xué)習(xí)模型應(yīng)該在各種學(xué)習(xí)任務(wù)上進(jìn)行訓(xùn)練,并對(duì)任務(wù)的分布(包括潛在的不可見任務(wù))進(jìn)行優(yōu)化以獲得最佳性能。每個(gè)任務(wù)都與一個(gè)數(shù)據(jù)集D相關(guān)聯(lián), 數(shù)據(jù)集D包含特征向量和真標(biāo)簽。最優(yōu)模型參數(shù)為:訓(xùn)練與測(cè)試的方式相同
一個(gè)數(shù)據(jù)集D包含多對(duì)特征向量和標(biāo)簽,D= {(xi, yi)},每個(gè)標(biāo)簽屬于-個(gè)已知的標(biāo)簽集L .把
帶有參數(shù)θ的分類器fθ輸出的一個(gè)數(shù)據(jù)點(diǎn)屬于類y的概率,記作Pθ(y |x)。
最優(yōu)參數(shù)應(yīng)該最大化的跨多個(gè)訓(xùn)練批次BcD的真實(shí)標(biāo)簽的概率:這里B指的是每個(gè)task, D指的整個(gè)元學(xué)習(xí)模型的所有task的集合。例如:分類就是一個(gè)B,即一個(gè)子task。而分類任務(wù)則
是D。這里要求的是,在所有分類任務(wù)上的真實(shí)標(biāo)簽的概率和的期望的最大θ。
參考:元學(xué)習(xí):學(xué)會(huì)快速學(xué)習(xí)
元學(xué)習(xí)的基本問題可以分成三大類:
「元知識(shí)的表征」(meta-representation)。元知識(shí)應(yīng)該如何進(jìn)行表征,這回答了元學(xué)習(xí)的最重要問題,即學(xué)習(xí)什么的問題。
「元學(xué)習(xí)器」(meta-optimizer)。即有了元知識(shí)的表征后,我們應(yīng)該如何選擇學(xué)習(xí)算法進(jìn)行優(yōu)化,也就回答了元學(xué)習(xí)中的如何學(xué)習(xí)的問題。
「元目標(biāo)」(meta-objective)。有了元知識(shí)的表征和學(xué)習(xí)方法后,我們應(yīng)該朝著怎樣的目標(biāo)去進(jìn)行學(xué)習(xí)?這回答了元學(xué)習(xí)中為什么要這樣學(xué)習(xí)的問題。
圍繞這三大基本問題,近年來元學(xué)習(xí)領(lǐng)域出現(xiàn)了諸多研究成果。按照此分類方法,meta-learning的研究框架可以由下圖清晰地給出:
參考:頂會(huì)的寵兒:元學(xué)習(xí)(Meta-learning)的前世今生
元學(xué)習(xí)的分類/方法:
1、基于記憶Memory的方法。
通過以往的經(jīng)驗(yàn)來學(xué)習(xí),那就可以通過在神經(jīng)網(wǎng)絡(luò)中添加Memory來實(shí)驗(yàn)。
2、基于預(yù)測(cè)梯度的方法。
讓神經(jīng)網(wǎng)絡(luò)利用以往的任務(wù)學(xué)習(xí)如何預(yù)測(cè)梯度,這樣面對(duì)新的任務(wù),只要梯度預(yù)測(cè)的準(zhǔn),那么學(xué)習(xí)就會(huì)快。
3、利用Attention注意力機(jī)制
訓(xùn)練一個(gè)Attention模型,在面對(duì)新任務(wù)時(shí),能夠直接的關(guān)注最重要部分。
4、借鑒LSTM的方法
利用LSTM的結(jié)構(gòu)訓(xùn)練處一個(gè)神經(jīng)網(wǎng)絡(luò)的更新機(jī)制,輸入當(dāng)前網(wǎng)絡(luò)參數(shù),直接輸出新的更新參數(shù)
5、面向RL的Meta Learning方法
既然Meta Learning可以用在監(jiān)督學(xué)習(xí),那么增強(qiáng)學(xué)習(xí)上又可以怎么做呢?能否通過增加一些外部信息的輸入比如reward,和之前的action來實(shí)驗(yàn)。
6、通過訓(xùn)練一個(gè)base model的方法,能同時(shí)應(yīng)用到監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)上
7、利用WaveNet的方法
WaveNet的網(wǎng)絡(luò)每次都利用了之前的數(shù)據(jù),那么能否照搬WaveNet的方式來實(shí)現(xiàn)Meta Learning呢?就是充分利用以往的數(shù)據(jù)。
8、預(yù)測(cè)Loss的方法
如果有更好的Loss,那么學(xué)習(xí)的速度也會(huì)更快,因此,可以構(gòu)建一個(gè)模型利用以往的任務(wù)來學(xué)習(xí)如何預(yù)測(cè)Loss
參考:“元學(xué)習(xí)”的理解
論文資源:元學(xué)習(xí)(Meta Learning)最全論文、視頻、書籍資源整理
代碼詳解:https://www.sohu.com/a/230607592_129720
九月下旬了 努力沖鴨?。?!





