我一直在思考,AI的熱潮到底能持續(xù)多久?為什么現(xiàn)在她如此熱,到底極限在哪里?
AI本次的熱潮是從06年深度學(xué)習(xí)問(wèn)世并且證明自己開(kāi)始在某個(gè)特定領(lǐng)域打敗一切其他對(duì)手開(kāi)始(圖像識(shí)別與分類)。
那么為什么深度學(xué)習(xí)讓大家這么興奮?
內(nèi)在原因來(lái)看,我們發(fā)現(xiàn)她做的比傳統(tǒng)方法好,而且也比傳統(tǒng)方法成本更低。
從成本來(lái)看:以前某個(gè)任務(wù)需要 3 個(gè)工程師從清洗數(shù)據(jù)、找特征、構(gòu)建模型、訓(xùn)練與應(yīng)用,這些都跑完一個(gè)流程,需要3個(gè)月。這還不算找特征、構(gòu)建模型這些工作需要很強(qiáng)的行業(yè)領(lǐng)域知識(shí)與工程經(jīng)驗(yàn)??偣蚕牧?個(gè)人月。
而深度學(xué)習(xí)所做的就是,現(xiàn)在只需要一個(gè)工程師,清洗數(shù)據(jù)、構(gòu)建模型、訓(xùn)練與應(yīng)用,可能只需要一個(gè)月,總共1個(gè)人月。
為什么?首先深度學(xué)習(xí)降低了找特征的成本,甚至可以說(shuō)在某些時(shí)候可以把這個(gè)過(guò)程忽略,在以前這個(gè)過(guò)程本身可能就需要3~5個(gè)人月的反復(fù)工程實(shí)驗(yàn)。而清洗數(shù)據(jù)也更快了,因?yàn)樯疃葘W(xué)習(xí)的魯棒性更好(rubust),尤其是針對(duì)大數(shù)據(jù)的魯棒性(百萬(wàn)條數(shù)據(jù))。如果放在2、3年前,深度學(xué)習(xí)的訓(xùn)練與應(yīng)用所需要的時(shí)間成本也不低,可是現(xiàn)在無(wú)論是各種框架(Torch,Keras,TensorFlow)也好,還是各種工程經(jīng)驗(yàn)也好,都更加充足了,使得時(shí)間成本越來(lái)越低。
從外在原因來(lái)看,深度學(xué)習(xí)遇到了兩個(gè)機(jī)遇:1、GPU(顯卡)速度很快,并且深度學(xué)習(xí)可利用,極大的降低了工程實(shí)驗(yàn)成本;2、互聯(lián)網(wǎng)數(shù)據(jù)獲取越來(lái)越容易,數(shù)據(jù)量越來(lái)越大(傳統(tǒng)方法很難處理一些領(lǐng)域的大數(shù)據(jù))。
你需要知道的:
- 深度學(xué)習(xí)不是萬(wàn)能藥,她可能不會(huì)、至少短期不會(huì)在所有領(lǐng)域上大放異彩
- 深度學(xué)習(xí)同樣需要領(lǐng)域知識(shí),處理文本和處理圖像的模型可以類似,但是細(xì)微差別就可能導(dǎo)致極大的不同,而找到最合適的模型需要工程師本身就有很強(qiáng)的經(jīng)驗(yàn)
- 深度學(xué)習(xí)并不昂貴,并且成本越來(lái)越低,前提是你知道你想要什么
- 深度學(xué)習(xí)需要其他各種知識(shí)與能力的配合,例如處理文本依然需要正則表達(dá)式,處理圖像與視頻,依然需要大量的相關(guān)知識(shí)
- 深度學(xué)習(xí)是機(jī)器學(xué)習(xí) + 大量的技巧與經(jīng)驗(yàn),深度學(xué)習(xí)實(shí)際并沒(méi)有超出機(jī)器學(xué)習(xí)范疇,各種傳統(tǒng)的測(cè)試、驗(yàn)證方法必須要有;傳統(tǒng)的聚類、分類、強(qiáng)化、回歸模型經(jīng)驗(yàn)也要有;除此之外,還需要熟悉深度學(xué)習(xí)的各種訓(xùn)練技巧
你可能想嘗試的:
- 把問(wèn)題總結(jié)好,尋找可能建模的點(diǎn)
- 假設(shè)你擁有一些數(shù)據(jù),人可以通過(guò)這些數(shù)據(jù)得出結(jié)論,深度學(xué)習(xí)可能也可以并且成本更低;假設(shè)你沒(méi)有數(shù)據(jù),或者人也無(wú)法僅僅從這些數(shù)據(jù)得到結(jié)論,那么深度學(xué)習(xí)很可能也無(wú)能為力
- 深度學(xué)習(xí)可能是一種低成本的嘗試點(diǎn),不要太高估她,不過(guò)至少你覺(jué)得有一點(diǎn)點(diǎn)可能性,最好咨詢相關(guān)專家,成本可能沒(méi)有你想象的那么高