1,前言 很久不發(fā)文章,整理些干貨,希望相互學(xué)習(xí)吧。進(jìn)入主題,本文主要時(shí)說(shuō)的為樸素貝葉斯分類(lèi)算法。與邏輯回歸,決策樹(shù)一樣,是較為廣泛使用的有監(jiān)督...
剛好最近經(jīng)常看一些word2vec的文章,在最后往往看到作者說(shuō)用t-SNE可視化結(jié)果,也即把高維度的數(shù)據(jù)降維并可視化。很奇怪作者為何不用PCA或...
Elasticsearch一般首要解決的問(wèn)題: 首先是中文分詞(目前默認(rèn)是IK,建議看下是否有沒(méi)其他更好的方案或可優(yōu)化得點(diǎn)) 其次相關(guān)性(搜索關(guān)...
由于語(yǔ)料缺乏,前期若使用到情感分析,建議暫時(shí)使用SnowNLP(此模塊主要使用淘寶評(píng)論語(yǔ)料)做情感挖掘,但不僅僅為單純調(diào)用,需要優(yōu)化,下面是一些...
搜狗新聞與清華新聞文章都是偏新聞?lì)悇e,若要商品類(lèi)別文本,則需要爬取,代碼如下,參考https://www.cnblogs.com/sirkevi...
Gradient boosting is one of the most powerful techniques for building pr...
目前我們的推薦算法單一且標(biāo)簽質(zhì)量一般,隨著業(yè)務(wù)量的增加需要使用多推薦算法融合: 1)生成推薦商品候選集算法選擇: 度算法融合的選型:**基于標(biāo)簽...