Stanford CoreNLP的源代碼是使用Java寫的,提供了Server方式進(jìn)行交互。stanfordcorenlp是一個對Stanford CoreNLP進(jìn)行了封裝的Python工具包,GitHub地址,使用非常方便。
安裝stanfordcorenlp包之前:
1:下載安裝JDK 1.8及以上版本。
2:下載Stanford CoreNLP文件,解壓。
3:處理中文還需要下載中文的模型[jar文件],然后放到stanford-corenlp-full根目錄下即可(注意一定要下載這個文件哦,否則它默認(rèn)是按英文來處理的)。
然后就是正常的流程
pip install stanford-corenlp
網(wǎng)上找了很多都是有點(diǎn)麻煩的配置,自己誤打誤撞弄出一個簡單的分享一下,有問題可以留言討論,
直接上代碼:
import corenlp client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split()) str = 'proved to be fake, made-up' ann = client.annotate(str) sentence = ann.sentence[0] for token in sentence.token: print (token.word, token.pos)
接下來就會報(bào)錯了,點(diǎn)進(jìn)報(bào)錯文檔,鎖定報(bào)錯地點(diǎn)
文檔時:client.py
地點(diǎn):124行

client.py
然后開始改代碼
124行:我直接注釋掉了

改后client.py
125行:將原來的{CORENLP_HOME}替換成你下載的Stanford CoreNLP文件,解壓后的文件目錄路徑。

改后client.py
126行:將原來的os.getenv("CORENLP_HOME")替換成你下載的Stanford CoreNLP文件,解壓后的文件目錄下的stanford-corenlp-3.9.1.jar路徑

改后client.py
然后再次運(yùn)行前的代碼,成功完成:
proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ
希望可以幫助到你。
版權(quán)聲明:本文為博主原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。