遷移學(xué)習(xí)實(shí)現(xiàn)將特定領(lǐng)域的模型應(yīng)用到多個(gè)目標(biāo)領(lǐng)域中,能夠促進(jìn)目標(biāo)領(lǐng)域模型的學(xué)習(xí)成長,并降低目標(biāo)領(lǐng)域內(nèi)對于數(shù)據(jù)量和類型的要求,實(shí)際上就是利用已有先驗(yàn)信息來優(yōu)化模型學(xué)習(xí)內(nèi)容。遷移學(xué)習(xí)在小數(shù)據(jù)環(huán)境、智能終端上具有廣闊的應(yīng)用空間,遷移學(xué)習(xí)需要將在數(shù)據(jù)量充足的情況下學(xué)習(xí)到的知識(shí),遷移到數(shù)據(jù)量小的新環(huán)境中,能夠通過發(fā)現(xiàn)大數(shù)據(jù)和小數(shù)據(jù)問題之間的關(guān)聯(lián),把知識(shí)從大數(shù)據(jù)中遷移到小數(shù)據(jù)問題中,從而打破人工智能對大數(shù)據(jù)的依賴。
這里還是要推薦下小編的大數(shù)據(jù)學(xué)習(xí)QQ裙:532218147,不管你是小白還是大牛,小編我都?xì)g迎,不定期分享干貨,包括小編自己整理的一份2018最新的大數(shù)據(jù)資料和0基礎(chǔ)入門教程,歡迎初學(xué)和進(jìn)階中的小伙伴。在不忙的時(shí)間我會(huì)給解答
遷移學(xué)習(xí)為兩類問題提供了解決路徑,這也是遷移學(xué)習(xí)存在的實(shí)際價(jià)值:
一是在數(shù)據(jù)樣本量小的行業(yè)中,人工智能學(xué)習(xí)、認(rèn)知的問題。比方說我們準(zhǔn)備新開一個(gè)售賣零食的網(wǎng)店,由于沒有數(shù)據(jù)積累,無法從售賣其他商品的網(wǎng)店推薦顧客來購買,這時(shí)候如果我們知道顧客買飲料的時(shí)候很有可能也會(huì)買零食,并且賣飲料的網(wǎng)店已經(jīng)積累了大量數(shù)據(jù),就能夠利用這些數(shù)據(jù),結(jié)合顧客買飲料和零食的習(xí)慣建一個(gè)模型。然后,把飲料的推薦模型遷移到零食的領(lǐng)域,這樣就可以成功推薦顧客購買可能喜歡的零食。這個(gè)例子足以說明遷移學(xué)習(xí)的應(yīng)用前提,即至少包括兩個(gè)領(lǐng)域,一個(gè)領(lǐng)域已經(jīng)積累了足夠多的數(shù)據(jù),能夠成功地建立算法模型;另外一個(gè)領(lǐng)域數(shù)據(jù)量不大,但是和前面那個(gè)領(lǐng)域是相互關(guān)聯(lián)的,這時(shí)就可以把前一個(gè)領(lǐng)域的模型遷移過來給后一個(gè)領(lǐng)域使用。
二是通用與個(gè)性化問題。平時(shí)在使用手機(jī)的時(shí)候,希望它能夠記住我們的一些生活習(xí)慣以方便使用,可以把常規(guī)用戶A使用手機(jī)的常見習(xí)慣,建立成為通用模型,當(dāng)其他用戶使用的時(shí)候,可以遷移通用模型到其個(gè)性化的數(shù)據(jù)中。這樣,A用戶的常見習(xí)慣就“遷移”成為了所有同類型用戶的“公共習(xí)慣”,讓所有人操作手機(jī)的時(shí)候都能夠更方便快捷。
但是不能講遷移學(xué)習(xí)不能簡單認(rèn)為就是小數(shù)據(jù)環(huán)境下的學(xué)習(xí)認(rèn)知問題,它是在深度學(xué)習(xí)基礎(chǔ)上實(shí)現(xiàn)廣泛應(yīng)用在小數(shù)據(jù)環(huán)境下的有效途徑。在特定領(lǐng)域內(nèi)通過大數(shù)據(jù)建立好深度學(xué)習(xí)應(yīng)用模型后,換一個(gè)領(lǐng)域進(jìn)行應(yīng)用,實(shí)際就是實(shí)現(xiàn)認(rèn)知學(xué)習(xí)中的聯(lián)想記憶、舉一反三的能力。
實(shí)現(xiàn)遷移學(xué)習(xí)的方法
1)樣本遷移,就是我們在數(shù)據(jù)集里面找到跟目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)放大多倍,這個(gè)叫做樣本遷移,通過樣本來達(dá)到遷移的目的;
2)特征遷移,可以觀察到有些相似的特征,然后利用這些特征,在不同的層次的特征,來進(jìn)行自動(dòng)的遷移;
3)基于模型的遷移學(xué)習(xí),利用上千萬的圖象來訓(xùn)練一個(gè)圖象識(shí)別的系統(tǒng),我們遇到一個(gè)新的圖象領(lǐng)域,我們就不用再去找?guī)浊f個(gè)圖象來訓(xùn)練了,我們就把原來的那個(gè)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬張圖片就夠,同樣可以得到很高的效果,模型遷移的一個(gè)好處是我們可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來,我們可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些;
4)通過關(guān)系進(jìn)行遷移,我們也可以通過關(guān)系來進(jìn)行遷移,比方說社會(huì)網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。
因?yàn)楝F(xiàn)階段的人工智能需要從海量數(shù)據(jù)中進(jìn)行學(xué)習(xí),但是對于很多特定垂直的領(lǐng)域而言,其數(shù)據(jù)并不足夠支持AI學(xué)習(xí),這時(shí)候就需要遷移學(xué)習(xí)來發(fā)揮巨大價(jià)值。比如在語音識(shí)別中,雖然識(shí)別普通話有海量數(shù)據(jù)可供人工智能學(xué)習(xí),但是對于方言,其樣本數(shù)據(jù)量就不夠。所以,為了針對數(shù)據(jù)量不那么多的方言進(jìn)行語音識(shí)別,百度需要把從學(xué)習(xí)普通話中得到的知識(shí)遷移到學(xué)習(xí)方言過程中,才能完成比較準(zhǔn)確的語音識(shí)別。
舉個(gè)栗子
Google的機(jī)器人和無人駕駛汽車就是使用了遷移學(xué)習(xí)進(jìn)行訓(xùn)練,通常會(huì)建設(shè)一個(gè)仿真的環(huán)境(數(shù)字虛擬),在場地中安排數(shù)百個(gè)機(jī)器人或虛擬無人汽車同時(shí)訓(xùn)練,可以極大提高人工智能的學(xué)習(xí)效率,并且不用擔(dān)心損耗問題。
當(dāng)Google通過這樣的方式訓(xùn)練出一個(gè)能夠在仿真環(huán)境中干家務(wù)的機(jī)器人時(shí),那么把它的智能遷移到實(shí)體的機(jī)器人中,這個(gè)機(jī)器人再經(jīng)過一定訓(xùn)練后也就可以做家務(wù)了。這對傳統(tǒng)機(jī)器人行業(yè)帶來的沖擊是巨大的。因?yàn)閭鹘y(tǒng)機(jī)器人的控制方法都依賴于人工,需要對每一種機(jī)器人進(jìn)行編程;而通過遷移學(xué)習(xí)的方式,機(jī)器人可以把在仿真環(huán)境中學(xué)會(huì)的知識(shí)運(yùn)用到真實(shí)的環(huán)境。這將為智能時(shí)代制造和訓(xùn)練機(jī)器人創(chuàng)造了最好的工具。