1.基于NGINX和thrif rpc的日志采集 1.1 軟件包準(zhǔn)備 前提環(huán)境:Hadoop+Flume+Hbase+zookeeper安裝環(huán)境...
投稿
1.基于NGINX和thrif rpc的日志采集 1.1 軟件包準(zhǔn)備 前提環(huán)境:Hadoop+Flume+Hbase+zookeeper安裝環(huán)境...
1.典型的信息流架構(gòu) 信息流是推薦系統(tǒng)應(yīng)用中的當(dāng)紅炸子雞,它表現(xiàn)形式有很多:社交網(wǎng)絡(luò)的動態(tài)信息流、新聞閱讀的圖文信息流、短視頻信息流等等。 整體...
1.LFM推薦 思路和ALS算法類似,區(qū)別在于,ALS利用坐標(biāo)下降法,LFM利用梯度下降法假設(shè): 評分矩陣????,??,m個用戶對n個物品評分:用戶...
隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時代走入了信息過載(information overload)的時代。在這個時代,無論是信息消費...
1.Spark MLlib概述 1.是什么:spark MLLib 是基于Spark 引擎實現(xiàn)的機(jī)器學(xué)習(xí)算法庫,spark開發(fā)應(yīng)用都是基于RDD...
1.Mahout介紹 1.1概述 根據(jù)百度的解說,Mahout 是 Apache Software Foundation(ASF) 旗下的一個開...
1.Spark ML重要概念 1.Spark ML基于什么來處理的? Spark-Core的核心開發(fā)是基于RDD,但是RDD并不是非常的靈活,如...
1.用戶畫像概述 1.1什么是用戶畫像 用戶畫像是對現(xiàn)實世界中用戶的數(shù)學(xué)建模 1.2用戶畫像特點 1.源于現(xiàn)實,高于現(xiàn)實用戶畫像是描述用戶的數(shù)據(jù)...
1.Lambda介紹: 提出者:Twitter工程師Nathan Marz提出,同時是Storm項目發(fā)起人Lambda作用:Lambda系統(tǒng)架構(gòu)...
1.思想簡介: 協(xié)同過濾,從字面上理解,包括協(xié)同和過濾兩個操作。所謂協(xié)同就是利用群體的行為來做決策(推薦)。對于推薦系統(tǒng)來說,通過用戶的持續(xù)協(xié)同...