幾本自然語言處理入門書

如果你剛接觸自然語言處理并對她感興趣,最好讀幾本這方面的書籍,除了能讓你知道自然語言處理各個領(lǐng)域是干什么的外,還能培養(yǎng)一下NLP的感覺。以下四本書是我讀研期間閱讀和接觸過的,如果您還有好書推薦,歡迎補充。
1、**《自然語言處理綜論》 **(Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition)

這本書的權(quán)威自不用說,譯者是馮志偉老師和孫樂老師,當年讀這本書的時候,還不知道馮老師是誰,但是讀起來感覺非常好,想想如果沒有在這個領(lǐng)域積攢多年的實力,是不可能翻譯的這么順暢的。這本書在國內(nèi)外的評價都比較好,對自然語言處理的兩個學派(語言學派和統(tǒng)計學派)所關(guān)注的內(nèi)容都有所包含,但因此也失去一些側(cè)重點。從我的角度來說更偏向于統(tǒng)計部分,所以需要了解統(tǒng)計自然語言處理的讀者下面兩本書更適合做基礎(chǔ)閱讀。不過這本書的N-gram語言模型部分寫得非常不錯,是SRILM的推薦閱讀參考。

2、《統(tǒng)計自然語言處理基礎(chǔ)(Foundations of Statistical Natural Language Processing)

我比較喜歡這本書,這兩年的學習過程中也經(jīng)常拿這本書作為參考,可能與我做統(tǒng)計機器翻譯有關(guān)吧??碿hina pub上的評論說這本書的翻譯比較差,自己的感覺是還行。當然,這是國內(nèi)翻譯圖書的一個通?。撼撕茈y有翻譯的非常好的書外,另外一個原因就是滯后性。如果e文足夠好的壞,就及時看英文版吧。這本書在統(tǒng)計基本部分的介紹很不錯,另外n元語法部分講得也比較好,也是SRILM的推薦閱讀。
3、《統(tǒng)計自然語言處理》
這是北京自動化所宗成慶老師今年5月出版的一本專著,我有幸較早的閱讀了這本書的很多章節(jié)。一個很強的感覺是:如果你想了解相關(guān)領(lǐng)域的國內(nèi)外最新進展,這本書非常值得一讀。上面兩本書在由于出版稍早的緣故,很多領(lǐng)域最新的方法都沒有介紹。而這本書剛剛出版,宗老師對國內(nèi)外現(xiàn)狀把握的也比較好,因此書中充分體現(xiàn)了這方面的信息。另外統(tǒng)計機器翻譯這一部分寫得很詳細很不錯,這可能與宗老師亦是這個領(lǐng)域的研究者有關(guān)吧。

4、《計算機自然語言處理》
這是我最早看的一部自然語言處理方面的書籍,和上面幾部大部頭的書籍相比,這本書很薄,可以很快的看完。書的內(nèi)容我都有點忘了,但是印象中可以在每個章節(jié)看到國內(nèi)這個領(lǐng)域的研究歷史和相關(guān)單位。這時才發(fā)現(xiàn)母校HIT在這個領(lǐng)域的超強實力,只是可惜這時候已經(jīng)離開冰城了。
這些書籍怎么讀都行,泛覽也罷,精讀也行,只要有時間,多讀書是沒壞處的。我自己的經(jīng)驗是,先泛泛的瀏覽或閱讀一篇,對于比較晦澀的部分可以先跳過去,然后對自己感興趣的領(lǐng)域或者將要從事的領(lǐng)域的相關(guān)章節(jié)進行精讀,當然,書籍一般在開始的幾個章節(jié)講些基礎(chǔ)性的知識,這部分最好也仔細揣摩一下。真正要對自己研究的領(lǐng)域深刻了解,還得好好讀一下本領(lǐng)域的相關(guān)論文。

轉(zhuǎn)載:“我愛自然語言處理”:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容