Jieba對(duì)中文進(jìn)行分詞,用戶可以自建自己的詞典,將一些特殊名詞或者固定名詞放在里面,jieba在分詞時(shí),將字典中的詞作為固定詞不再拆解,提高分詞的準(zhǔn)確性。現(xiàn)在遇到一個(gè)問題,例如“史記·大宛列傳”,這種是一個(gè)詞,但是中間有一個(gè)黑點(diǎn),這樣jieba就不能識(shí)別到“史記·大宛列傳”是一個(gè)詞。該如何解決?
userdict遇到的問題
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- jieba分詞,學(xué)習(xí),為了全面了解該模塊,,預(yù)設(shè)學(xué)習(xí)路線:官方文檔——優(yōu)秀博客文章——實(shí)踐學(xué)習(xí) 官方文檔部分 (文...
- 參考:Python 中文分詞組件 jiabaPython中文分詞 jieba 十五分鐘入門與進(jìn)階jieba完整文檔...
- 常用概念: 自然語言處理(NLP) 數(shù)據(jù)挖掘 推薦算法 用戶畫像 知識(shí)圖譜 信息檢索 文本分類 常用技術(shù): 詞級(jí)別...
- 1: dom對(duì)象的innerText和innerHTML的區(qū)別 innerText只獲取該元素內(nèi)的文本,inner...
- 讀了作者伊心寫的《我二十歲過得很不好,但我不會(huì)一生過得都不好》一文,有許多感慨。 我回想我的二十歲。二十歲時(shí)候的我...