1.考研:2-3年
2.NLP學(xué)習(xí):這5年貫穿始終
我不清楚別人。我給你說下我學(xué)NLP的背景吧。我是本科 cs 專業(yè)加碩士cs專業(yè)NLP方向目前是NLP博士在讀。
1.數(shù)學(xué)基礎(chǔ)課很重要
高等數(shù)學(xué) 線性代數(shù) 概率統(tǒng)計(jì) 三大數(shù)學(xué)基礎(chǔ)課。推薦mit 的微積分公開課和臺大教授李宏毅的線性代數(shù)課。概率統(tǒng)計(jì)相對簡單,可以自己拿教材學(xué)一學(xué),也可以網(wǎng)上找找公開課。
2.計(jì)算機(jī)基礎(chǔ)也很重要
a. 至少學(xué)會兩到三門編程語言 其中一定包括python
b. 數(shù)據(jù)結(jié)構(gòu)和算法,操作系統(tǒng),計(jì)算機(jī)網(wǎng)絡(luò),計(jì)算機(jī)系統(tǒng)組成四大基礎(chǔ)課必學(xué)。數(shù)據(jù)庫和編譯原理推薦學(xué)習(xí)。這部分直接有利于之后寫代碼的時候找bug。因?yàn)槌霈F(xiàn)問題后很多計(jì)算機(jī)知識就會紛至沓來帶你找到原因而不是變成無頭蒼蠅。
3.機(jī)器學(xué)習(xí)基礎(chǔ)
a. 李航教授的《統(tǒng)計(jì)學(xué)習(xí)方法》必學(xué)
b. 周志華教授的西瓜書推薦
c. 深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)必學(xué)
d. 各種深度學(xué)習(xí)框架如tensorflow,pytorch
可以找網(wǎng)課學(xué)習(xí)比如斯坦福公開課,臺大教授李宏毅的課,吳恩達(dá)的課
4.NLP 基礎(chǔ)
推薦斯坦福224系列和何晗著的《自然語言處理入門》(ps:何晗之前是學(xué)日語轉(zhuǎn)的nlp@hankcs)還有 很多大佬著的《speech and language processing》
5.其他
各種基礎(chǔ)雖然很重要,但如果想快速上手還是要多寫代碼練習(xí)。github上有很多好項(xiàng)目可以去看看。研究深入之后可以開始看行業(yè)論文。
整個過程快的話歷時2-3年(必須起早搭黑的學(xué)),慢的話至少5年,特別慢的話十年也不是沒有可能(我從本科開始到今年也第8年了)。當(dāng)然如果只是想玩兒一玩兒那就無所謂了。所以加油吧少年!