現(xiàn)在,深度學(xué)習(xí)入門相較于幾年前,已經(jīng)門檻非常低了,既有大量的中文資料,又有現(xiàn)成的訓(xùn)練平臺(tensorflow和pytorch),但是我們?nèi)匀恍枰恍┘记伞?/p>
首先,第一步,也是必須的一步,就是補(bǔ)習(xí)一下微積分的知識。
可能有同學(xué)一聽到微積分就頭痛,不過沒關(guān)系,深度學(xué)習(xí)用的微積分知識不多,主要是導(dǎo)數(shù),梯度,鏈?zhǔn)椒▌t?;旧弦簿褪菚弦粌烧碌膬?nèi)容,這些弄懂基本足夠了。
如果想深入一些,可以再補(bǔ)一補(bǔ)函數(shù)極值,牛頓法,矩陣分解,這些知識點大都是傳統(tǒng)機(jī)器學(xué)習(xí)的必需品,深度學(xué)習(xí)已經(jīng)沒有那么講究了。

接下來,需要選擇你的打怪路線,我們主要分兩類人,第一類是學(xué)理科出身的,比如數(shù)學(xué)物理;第二類是學(xué)計算機(jī)出身的。
第一類人,優(yōu)勢是公式推導(dǎo)和理論,所以我們需要從理論入手,深度學(xué)習(xí)的重點理論有:神經(jīng)網(wǎng)絡(luò)的前向傳播,神經(jīng)網(wǎng)絡(luò)的反向傳播,梯度下降法,隨機(jī)梯度下降法,批梯度下降法,動量梯度下降法,adam梯度下降法,神經(jīng)網(wǎng)絡(luò)的梯度消失與爆炸問題,神經(jīng)網(wǎng)絡(luò)的正則化,dropout,batchnorm,softmax公式,交叉熵?fù)p失等等。
還有一個重點,就是最新的理論(面試重點),必須要熟悉一個,比如說幾年前,你得把a(bǔ)dam梯度下降法弄熟了,這兩年是batchnorm,transformer,未來幾年可能是模型的剪枝和壓縮或者圖神經(jīng)網(wǎng)絡(luò),那么這些知識點從哪獲得呢?
如果你的英語水平還可以,那么我推薦你直接看論文。有的同學(xué)可能會喜歡看書,那么為什么書沒有論文好呢?首先,看書無法得到最新進(jìn)展,因為我也寫過書,我知道從寫書到最后發(fā)表,至少要經(jīng)過一年的時間,而深度學(xué)習(xí)領(lǐng)域更新?lián)Q代非???,一年前的知識很可能已經(jīng)用不上了。其次,書往往是什么內(nèi)容都講,而你可能需要的是某一個問題的深入理解。
如何查找論文?很簡單,對于以前的內(nèi)容,直接搜索知識點名字即可,論文基本都是全網(wǎng)免費的,對于最新的知識點,需要關(guān)注一下AI頂會:CVPR、NIPS、ICML,其他會議排名可查看:https://www.aminer.cn/ranks/conf。

當(dāng)然,喜歡看書的同學(xué)或是英文不太熟練的同學(xué),也有很多好書,比如我們常說的花書:Ian Goodfellow、Yoshua Bengio 和Aaron Courville寫的深度學(xué)習(xí)、Deep Learning with Python、Machine Learning Yearning、Neural Networks and Deep Learning等。
最后,大家也可以找到很多深度學(xué)習(xí)的課程,但是不推薦大家直接看課程,因為在課程中,每個老師都或多或少把自己的理解放入,很容易影響初學(xué)者。
比如我一開始就看的李宏毅的課程,到現(xiàn)在還是“深受其害”。比較推薦的課程有:李宏毅的機(jī)器學(xué)習(xí),斯坦福的深度學(xué)習(xí)公開課,深度學(xué)習(xí)的應(yīng)用。當(dāng)然,你也可以關(guān)注我,哈哈。

接下來說第二類人,計算機(jī)科班出身,那么你要做的就是直接先擼代碼,這個現(xiàn)在也很簡單,無論是keras,tensorflow,還是pytorch,都是基于python的,并且有詳細(xì)的教程(中文),你需要會學(xué)哪些代碼呢?
首先,肯定是實現(xiàn)各種神經(jīng)網(wǎng)絡(luò),一般第一個項目是手寫數(shù)字識別,然后是cifar10,cifar100,imagenet,電影評論數(shù)據(jù),wiki爬蟲文本這些通用的數(shù)據(jù)集。
不管三七二十一,將平臺的教程全部碼一遍代碼,把幾種常用的網(wǎng)絡(luò)(DNN、CNN、RNN、LSTM),損失函數(shù),激活函數(shù),優(yōu)化器,正則化方法都搞熟練了。
然后,弄懂平臺如何提高深度學(xué)習(xí)的效率,包括分布式計算,GPU的使用,多GPU的使用,數(shù)據(jù)流式處理,計算圖的區(qū)別。
其次,積累一些調(diào)參的經(jīng)驗,一般來說,教程里給的參數(shù)都不是效果最好的,你需要花時間去做調(diào)參,當(dāng)然也可以用自動化的調(diào)參工具(Ray tune),最后,需要積累一些項目,比如車牌識別,人臉識別,AI換臉,AI醫(yī)療,項目越新越好,不用做的很好,將流程跑通即可。
接下來,兩類人身份轉(zhuǎn)換,分別去學(xué)對方的第一步即可??傊?,對于初學(xué)者,我們要做的就是揚長避短,先做自己最熟悉的,幫助自己快速入門。還有一個小技巧分享給大家,就是多面試,面試官問了啥,回去就學(xué)啥,很快你就會發(fā)現(xiàn)你基本都會了。
最后,當(dāng)你入門了之后,就面臨一個選擇了,現(xiàn)在深度學(xué)習(xí)有這么幾大方向:計算機(jī)視覺、自然語言處理、語音識別、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí),你需要選擇一個適合自己的。當(dāng)然,你覺得自己能力夠強(qiáng),完全可以把他們?nèi)跁炌ā?/p>
計算機(jī)視覺(卷積神經(jīng)網(wǎng)絡(luò))上手難度最低,模型效果已經(jīng)全面趕超人類水平,但是領(lǐng)域已經(jīng)趨近于飽和,近年來也沒有劃時代的變化,崗位需求一般,不容易有進(jìn)一步發(fā)展,最經(jīng)典的論文有Alexnet,ResNet,EfficientNet,書籍有Computer Vision: Algorithms and Applications、Computer Vision: Models, Learning, and Inference,課程有斯坦福大學(xué)李飛飛教授的課程。
自然語言處理(循環(huán)神經(jīng)網(wǎng)絡(luò)),上手難度中等,模型效果略微落后人類水平,最近在bert和transformer網(wǎng)絡(luò)的興起下,發(fā)展勢頭迅猛,未來幾年崗位需求巨大,上升空間明顯,但是落地項目較少。最經(jīng)典的論文有Bert:Bidirectional Encoder Representations from Transformers、Improving Language Understanding by Generative Pre-Training,書籍有Speech and Language Processing、Neural Network Methods in Natural Language Processing,課程有微軟自然語言處理、斯坦福CS224n、Coursera免費課程。
語音識別(時間序列模型),上手難度非常高,模型效果遠(yuǎn)遠(yuǎn)不及人類,主要難點在噪聲環(huán)境下的語音識別,崗位需求一般,未來前景不明朗。
最經(jīng)典的論文有Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups、Deep speech 2: End-to-end speech recognition in english and mandarin、Achieving Human Parity in Conversational Speech Recognition,書籍有語音識別基本原理、Speech and Language Processing,工具有kaldi開源工具箱。
推薦系統(tǒng)(FM模型),上手難度中等,移動互聯(lián)網(wǎng)的中堅力量,崗位需求多,代碼能力要求高,上升空間明顯,推薦系統(tǒng)對數(shù)據(jù)依賴性強(qiáng),特征工程要高,一般來說只有大公司能做。
最經(jīng)典的論文有Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model、Item-Based Collaborative Filtering Recommendation Algorithms、Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions,書籍有推薦系統(tǒng)實踐、推薦系統(tǒng) : 技術(shù)、評估及高效算法、Recommender Systems: The Textbook,課程有coursea上的Recommender Systems Specialization。
強(qiáng)化學(xué)習(xí)(actor-agent交互模型),上手難度高,暫時主要用于游戲AI,棋類軟件,預(yù)期應(yīng)用廣泛,媒體宣傳的很賣力(alphago),但是雷聲大雨點小,崗位需求一般,未來前景暫不明朗。經(jīng)典論文有:Playing Atari with Deep Reinforcement Learning、Deep Reinforcement Learning with Double Q-learning、Prioritized Experience Replay,書籍有Reinforcement Learning : An introduction,課程有UCB的CS294。
