國內(nèi)用CRF做中文分詞的開源系統(tǒng)的主要是哈工大的HITLTP語言技術(shù)平臺(tái),該項(xiàng)目的源代碼可以從https://github.com/HIT-SCIR/ltp/releases...
IP屬地:江蘇
國內(nèi)用CRF做中文分詞的開源系統(tǒng)的主要是哈工大的HITLTP語言技術(shù)平臺(tái),該項(xiàng)目的源代碼可以從https://github.com/HIT-SCIR/ltp/releases...
sklearn里集成了一個(gè)數(shù)據(jù)集,里面有20類新聞的文本數(shù)據(jù),而樸素貝葉斯算法在文本分類的應(yīng)用場景中十分實(shí)用。今天就用naive_bayes來練習(xí)一下文本分類。上碼:...