IP屬地:浙江
LDA模型應(yīng)用:一眼看穿希拉里的郵件 我們拿到希拉里泄露的郵件,跑一把LDA,看看她平時(shí)都在聊什么。 首先,導(dǎo)入我們需要的一些庫(kù) 然后,把郵件讀...
Gensim的基本用法 Gensim非常適合用來實(shí)現(xiàn)各種文本模型、主題模型,包括tf-idf模型、LSI模型以及LDA模型。本節(jié)簡(jiǎn)單介紹一下Ge...
TF-IDF,理解起來相當(dāng)簡(jiǎn)單,他實(shí)際上就是TF*IDF,兩個(gè)計(jì)算值的乘積,用來衡量一個(gè)詞庫(kù)中的詞對(duì)每一篇文檔的重要程度。下面我們分開來講這兩個(gè)...
貝葉斯公式 貝葉斯公式就一行: 而它其實(shí)是由以下的聯(lián)合概率公式推導(dǎo)出來: 其中 P(Y) 叫做先驗(yàn)概率, P(Y|X) 叫做后驗(yàn)概率, P(Y,...
jieba.cut 以及 jieba.cut_for_search 相同點(diǎn):1 返回值都是迭代值。2.接受參數(shù)都有(1)需要分詞的字符串(2)是...