“深度學(xué)習(xí)”如何入門?學(xué)習(xí)路徑篇

現(xiàn)在,深度學(xué)習(xí)入門相較于幾年前,已經(jīng)門檻非常低了,既有大量的中文資料,又有現(xiàn)成的訓(xùn)練平臺(tensorflow和pytorch),但是我們?nèi)匀恍枰恍┘记伞?/p>


首先,第一步,也是必須的一步,就是補(bǔ)習(xí)一下微積分的知識。


可能有同學(xué)一聽到微積分就頭痛,不過沒關(guān)系,深度學(xué)習(xí)用的微積分知識不多,主要是導(dǎo)數(shù),梯度,鏈?zhǔn)椒▌t?;旧弦簿褪菚弦粌烧碌膬?nèi)容,這些弄懂基本足夠了。


如果想深入一些,可以再補(bǔ)一補(bǔ)函數(shù)極值,牛頓法,矩陣分解,這些知識點大都是傳統(tǒng)機(jī)器學(xué)習(xí)的必需品,深度學(xué)習(xí)已經(jīng)沒有那么講究了。



接下來,需要選擇你的打怪路線,我們主要分兩類人,第一類是學(xué)理科出身的,比如數(shù)學(xué)物理;第二類是學(xué)計算機(jī)出身的。

第一類人,優(yōu)勢是公式推導(dǎo)和理論,所以我們需要從理論入手,深度學(xué)習(xí)的重點理論有:神經(jīng)網(wǎng)絡(luò)的前向傳播,神經(jīng)網(wǎng)絡(luò)的反向傳播,梯度下降法,隨機(jī)梯度下降法,批梯度下降法,動量梯度下降法,adam梯度下降法,神經(jīng)網(wǎng)絡(luò)的梯度消失與爆炸問題,神經(jīng)網(wǎng)絡(luò)的正則化,dropout,batchnorm,softmax公式,交叉熵?fù)p失等等。


還有一個重點,就是最新的理論(面試重點),必須要熟悉一個,比如說幾年前,你得把a(bǔ)dam梯度下降法弄熟了,這兩年是batchnorm,transformer,未來幾年可能是模型的剪枝和壓縮或者圖神經(jīng)網(wǎng)絡(luò),那么這些知識點從哪獲得呢?


如果你的英語水平還可以,那么我推薦你直接看論文。有的同學(xué)可能會喜歡看書,那么為什么書沒有論文好呢?首先,看書無法得到最新進(jìn)展,因為我也寫過書,我知道從寫書到最后發(fā)表,至少要經(jīng)過一年的時間,而深度學(xué)習(xí)領(lǐng)域更新?lián)Q代非???,一年前的知識很可能已經(jīng)用不上了。其次,書往往是什么內(nèi)容都講,而你可能需要的是某一個問題的深入理解。

如何查找論文?很簡單,對于以前的內(nèi)容,直接搜索知識點名字即可,論文基本都是全網(wǎng)免費的,對于最新的知識點,需要關(guān)注一下AI頂會:CVPR、NIPS、ICML,其他會議排名可查看:https://www.aminer.cn/ranks/conf。



當(dāng)然,喜歡看書的同學(xué)或是英文不太熟練的同學(xué),也有很多好書,比如我們常說的花書:Ian Goodfellow、Yoshua Bengio 和Aaron Courville寫的深度學(xué)習(xí)、Deep Learning with Python、Machine Learning Yearning、Neural Networks and Deep Learning等。


最后,大家也可以找到很多深度學(xué)習(xí)的課程,但是不推薦大家直接看課程,因為在課程中,每個老師都或多或少把自己的理解放入,很容易影響初學(xué)者。


比如我一開始就看的李宏毅的課程,到現(xiàn)在還是“深受其害”。比較推薦的課程有:李宏毅的機(jī)器學(xué)習(xí),斯坦福的深度學(xué)習(xí)公開課,深度學(xué)習(xí)的應(yīng)用。當(dāng)然,你也可以關(guān)注我,哈哈。



接下來說第二類人,計算機(jī)科班出身,那么你要做的就是直接先擼代碼,這個現(xiàn)在也很簡單,無論是keras,tensorflow,還是pytorch,都是基于python的,并且有詳細(xì)的教程(中文),你需要會學(xué)哪些代碼呢?


首先,肯定是實現(xiàn)各種神經(jīng)網(wǎng)絡(luò),一般第一個項目是手寫數(shù)字識別,然后是cifar10,cifar100,imagenet,電影評論數(shù)據(jù),wiki爬蟲文本這些通用的數(shù)據(jù)集。


不管三七二十一,將平臺的教程全部碼一遍代碼,把幾種常用的網(wǎng)絡(luò)(DNN、CNN、RNN、LSTM),損失函數(shù),激活函數(shù),優(yōu)化器,正則化方法都搞熟練了。


然后,弄懂平臺如何提高深度學(xué)習(xí)的效率,包括分布式計算,GPU的使用,多GPU的使用,數(shù)據(jù)流式處理,計算圖的區(qū)別。


其次,積累一些調(diào)參的經(jīng)驗,一般來說,教程里給的參數(shù)都不是效果最好的,你需要花時間去做調(diào)參,當(dāng)然也可以用自動化的調(diào)參工具(Ray tune),最后,需要積累一些項目,比如車牌識別,人臉識別,AI換臉,AI醫(yī)療,項目越新越好,不用做的很好,將流程跑通即可。


接下來,兩類人身份轉(zhuǎn)換,分別去學(xué)對方的第一步即可??傊?,對于初學(xué)者,我們要做的就是揚長避短,先做自己最熟悉的,幫助自己快速入門。還有一個小技巧分享給大家,就是多面試,面試官問了啥,回去就學(xué)啥,很快你就會發(fā)現(xiàn)你基本都會了。


最后,當(dāng)你入門了之后,就面臨一個選擇了,現(xiàn)在深度學(xué)習(xí)有這么幾大方向:計算機(jī)視覺、自然語言處理、語音識別、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí),你需要選擇一個適合自己的。當(dāng)然,你覺得自己能力夠強(qiáng),完全可以把他們?nèi)跁炌ā?/p>


計算機(jī)視覺(卷積神經(jīng)網(wǎng)絡(luò))上手難度最低,模型效果已經(jīng)全面趕超人類水平,但是領(lǐng)域已經(jīng)趨近于飽和,近年來也沒有劃時代的變化,崗位需求一般,不容易有進(jìn)一步發(fā)展,最經(jīng)典的論文有Alexnet,ResNet,EfficientNet,書籍有Computer Vision: Algorithms and Applications、Computer Vision: Models, Learning, and Inference,課程有斯坦福大學(xué)李飛飛教授的課程。


自然語言處理(循環(huán)神經(jīng)網(wǎng)絡(luò)),上手難度中等,模型效果略微落后人類水平,最近在bert和transformer網(wǎng)絡(luò)的興起下,發(fā)展勢頭迅猛,未來幾年崗位需求巨大,上升空間明顯,但是落地項目較少。最經(jīng)典的論文有Bert:Bidirectional Encoder Representations from Transformers、Improving Language Understanding by Generative Pre-Training,書籍有Speech and Language Processing、Neural Network Methods in Natural Language Processing,課程有微軟自然語言處理、斯坦福CS224n、Coursera免費課程。


語音識別(時間序列模型),上手難度非常高,模型效果遠(yuǎn)遠(yuǎn)不及人類,主要難點在噪聲環(huán)境下的語音識別,崗位需求一般,未來前景不明朗。


最經(jīng)典的論文有Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups、Deep speech 2: End-to-end speech recognition in english and mandarin、Achieving Human Parity in Conversational Speech Recognition,書籍有語音識別基本原理、Speech and Language Processing,工具有kaldi開源工具箱。


推薦系統(tǒng)(FM模型),上手難度中等,移動互聯(lián)網(wǎng)的中堅力量,崗位需求多,代碼能力要求高,上升空間明顯,推薦系統(tǒng)對數(shù)據(jù)依賴性強(qiáng),特征工程要高,一般來說只有大公司能做。

最經(jīng)典的論文有Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model、Item-Based Collaborative Filtering Recommendation Algorithms、Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions,書籍有推薦系統(tǒng)實踐、推薦系統(tǒng) : 技術(shù)、評估及高效算法、Recommender Systems: The Textbook,課程有coursea上的Recommender Systems Specialization。


強(qiáng)化學(xué)習(xí)(actor-agent交互模型),上手難度高,暫時主要用于游戲AI,棋類軟件,預(yù)期應(yīng)用廣泛,媒體宣傳的很賣力(alphago),但是雷聲大雨點小,崗位需求一般,未來前景暫不明朗。經(jīng)典論文有:Playing Atari with Deep Reinforcement Learning、Deep Reinforcement Learning with Double Q-learning、Prioritized Experience Replay,書籍有Reinforcement Learning : An introduction,課程有UCB的CS294。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • ?xml version="1.0" encoding="UTF-8"? 摘要:作為一名軟件工程師,我們應(yīng)該活到老...
    Anymake閱讀 667評論 0 5
  • 姓名:苗春雨 學(xué)號:16019110036 轉(zhuǎn)載自:http://blog.csdn.net/anymake_...
    MASTER__TONY閱讀 949評論 0 8
  • 久違的晴天,家長會。 家長大會開好到教室時,離放學(xué)已經(jīng)沒多少時間了。班主任說已經(jīng)安排了三個家長分享經(jīng)驗。 放學(xué)鈴聲...
    飄雪兒5閱讀 7,852評論 16 22
  • 今天感恩節(jié)哎,感謝一直在我身邊的親朋好友。感恩相遇!感恩不離不棄。 中午開了第一次的黨會,身份的轉(zhuǎn)變要...
    余生動聽閱讀 10,900評論 0 11
  • 可愛進(jìn)取,孤獨成精。努力飛翔,天堂翱翔。戰(zhàn)爭美好,孤獨進(jìn)取。膽大飛翔,成就輝煌。努力進(jìn)取,遙望,和諧家園??蓯塾巫?..
    趙原野閱讀 3,522評論 1 1

友情鏈接更多精彩內(nèi)容