Python3 環(huán)境下的 NLTK學習(第一章)

? ? ? 最近想入門NLP,于是找了一些資源來看,其中有一本書很不錯,叫Python自然語言處理,我看的是中文版,翻譯質量一般,不過別人也是無償的,只能說很敬佩。不過有一個小問題就是它的python版本是2.4,而我的是3.6,我用的NLTK也是3以上的版本,所以書中的許多例子都有些不太一樣,下面我就羅列一下不太一樣的地方。


1. P.28 text3.generate()失效

2.全文翻譯“鏈表”現一般稱作“列表”

3. text5.count('lol')/len(text5) 直接可得頻率比值,無需import __future__

4. fdist1現在不是按照詞頻排序了,應該是亂序,你必須自己排序

5.fdist1.plot(50,cumulative = True) 縱軸不是百分比,而是數值

6.fdist.inc(‘item')添加語料功能已失效

7.fdist.tabulate() 繪制頻率分布表功能實現為亂碼)

8.bigrams()失效

9.babelize_shell()失效 。。。好可惜啊

10.nltk.chat.chatbots()有嚴重BUG,程序應該是將回車鍵當作輸入值導致其無限循環(huán)而陷入死機,解決辦法是如圖直接訪問機器人名字

以下是我做的筆記,有想看的同學可以到我的Github主頁上去下載,以后章節(jié)的筆記也會持續(xù)更新,敬請關注!


最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容