? ? ? 最近想入門NLP,于是找了一些資源來看,其中有一本書很不錯,叫Python自然語言處理,我看的是中文版,翻譯質量一般,不過別人也是無償的,只能說很敬佩。不過有一個小問題就是它的python版本是2.4,而我的是3.6,我用的NLTK也是3以上的版本,所以書中的許多例子都有些不太一樣,下面我就羅列一下不太一樣的地方。
1. P.28 text3.generate()失效
2.全文翻譯“鏈表”現一般稱作“列表”
3. text5.count('lol')/len(text5) 直接可得頻率比值,無需import __future__
4. fdist1現在不是按照詞頻排序了,應該是亂序,你必須自己排序
5.fdist1.plot(50,cumulative = True) 縱軸不是百分比,而是數值
6.fdist.inc(‘item')添加語料功能已失效
7.fdist.tabulate() 繪制頻率分布表功能實現為亂碼)
8.bigrams()失效
9.babelize_shell()失效 。。。好可惜啊
10.nltk.chat.chatbots()有嚴重BUG,程序應該是將回車鍵當作輸入值導致其無限循環(huán)而陷入死機,解決辦法是如圖直接訪問機器人名字

以下是我做的筆記,有想看的同學可以到我的Github主頁上去下載,以后章節(jié)的筆記也會持續(xù)更新,敬請關注!
