前言 LDA是文本挖掘中最常用的主題模型之一,其可以理解為一篇文章有N個(gè)主題,每個(gè)主題有N個(gè)高頻詞匯,也可以理解為主題是一個(gè)bucket,里面裝入一堆頻率較高的詞。本文根據(jù)搜...
IP屬地:四川
前言 LDA是文本挖掘中最常用的主題模型之一,其可以理解為一篇文章有N個(gè)主題,每個(gè)主題有N個(gè)高頻詞匯,也可以理解為主題是一個(gè)bucket,里面裝入一堆頻率較高的詞。本文根據(jù)搜...
前言 基于物品的個(gè)性化協(xié)同過(guò)濾推薦,即ItemCF ,說(shuō)白了就是根據(jù)你喜歡的物品給你推薦相似的物品。不過(guò)作為推薦召回算法中的一種,也是重要的,該算法比較適合物品較少的場(chǎng)景,能...
從2020年年初開始,就給自己定了一個(gè)目標(biāo),簡(jiǎn)書目標(biāo)今年10萬(wàn)字,現(xiàn)在復(fù)盤,已經(jīng)寫了4萬(wàn)還差六萬(wàn)。 幾乎是一個(gè)月更一萬(wàn)。從最開始的無(wú)從下筆,到如今,每天一千字已經(jīng)不費(fèi)力,我想...
SparkStreaming是基于spark的流計(jì)算框架,其可以實(shí)現(xiàn)高吞吐量的,具備容錯(cuò)機(jī)制的實(shí)時(shí)流數(shù)據(jù)處理。 Spark Streaming將接收到的實(shí)時(shí)流數(shù)據(jù),按照一定時(shí)...