StanfordCoreNLP 使用筆記

1、在使用 StanfordCoreNLP (下面簡稱為:nlp) 的時候,如果在使用完不關閉服務的話(調用 close() 方法),那么 nlp 是不會主動關閉服務進程的

2、一個 nlp 服務進程大概占用的內存為 4g?

3、可以通過參數 memory 來指定 nlp 服務所占用的 內存,可選的值為 4g、6g、8g。值得注意的是,并不一定會占用指定的 memory 這么多內存,

而是以實際占用內存為主。例如如果指定的參數 memory 值為 4g,但實際使用的內存僅為 1g,則 nlp 服務會只占用 1g 內存,而不是 4g

4、在定義 nlp 時是不會加載資源的,而是在使用的時候才會加載資源。例如分詞的時候,在定義 nlp 時不加載資源,而是在使用 word_tokenize 方法來進行分詞時才加載資源。并且僅在第一次的時候加載資源,在第二次及之后的調用中是不加載資源的。

5、nlp 加載資源的時間約為 8.5 秒(在使用 word_tokenize 時是花費這么多時間,其他方法還未測試過)

6、在不包括第一次調用 word_tokenize 的情況下,分詞所花費的平均時間約為 0.1 秒

7、word_tokenize 不支持自定義字典

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容