Stanford CoreNLP Python接口處理

Stanford CoreNLP的源代碼是使用Java寫的,提供了Server方式進(jìn)行交互。stanfordcorenlp是一個對Stanford CoreNLP進(jìn)行了封裝的Python工具包,GitHub地址,使用非常方便。

安裝stanfordcorenlp包之前:
1:下載安裝JDK 1.8及以上版本。
2:下載Stanford CoreNLP文件,解壓。
3:處理中文還需要下載中文的模型[jar文件],然后放到stanford-corenlp-full根目錄下即可(注意一定要下載這個文件哦,否則它默認(rèn)是按英文來處理的)。

然后就是正常的流程

pip install stanford-corenlp

網(wǎng)上找了很多都是有點(diǎn)麻煩的配置,自己誤打誤撞弄出一個簡單的分享一下,有問題可以留言討論,

直接上代碼:

import corenlp
client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split())
str = 'proved to be fake, made-up'
ann = client.annotate(str)
sentence = ann.sentence[0]
for token in sentence.token:
    print (token.word, token.pos)

接下來就會報(bào)錯了,點(diǎn)進(jìn)報(bào)錯文檔,鎖定報(bào)錯地點(diǎn)

文檔時:client.py
地點(diǎn):124行

鎖定前三行
client.py

然后開始改代碼

124行:我直接注釋掉了

改后client.py

125行:將原來的{CORENLP_HOME}替換成你下載的Stanford CoreNLP文件,解壓后的文件目錄路徑。
改后client.py

126行:將原來的os.getenv("CORENLP_HOME")替換成你下載的Stanford CoreNLP文件,解壓后的文件目錄下的stanford-corenlp-3.9.1.jar路徑
改后client.py

然后再次運(yùn)行前的代碼,成功完成:

proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ

希望可以幫助到你。
版權(quán)聲明:本文為博主原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容