本章主要總結(jié)開發(fā)性能調(diào)優(yōu)及作業(yè)調(diào)度相關(guān)的產(chǎn)品知識,性能調(diào)優(yōu)主要是減少性能消耗和提高ETL作業(yè)時間,常見的調(diào)優(yōu)就會數(shù)據(jù)傾斜調(diào)優(yōu)、合并小文件、緩存中...
標(biāo)簽數(shù)據(jù)開發(fā)是用戶畫像體系中最重要的一環(huán),主要包括離線標(biāo)簽開發(fā)、實時標(biāo)簽開發(fā)、用戶特征庫開發(fā)、人群計算、打通數(shù)據(jù)服務(wù)層等開發(fā)內(nèi)容。 一、統(tǒng)計類標(biāo)...
用戶畫像的數(shù)據(jù)存儲的技術(shù)選型有多種,不同存儲方式適用于不同場景。主要有Hive、MySQL、HBase、Elasticsearch。 如果將用戶...
數(shù)據(jù)指標(biāo)體系是建立用戶畫像的基礎(chǔ),也是在進入開發(fā)前的關(guān)鍵環(huán)節(jié),是需要結(jié)合業(yè)務(wù)場景制定的數(shù)據(jù)指標(biāo)。建立用戶畫像一般從2個維度: ①用戶維度(use...
用戶畫像,即用戶信息標(biāo)簽化,是大數(shù)據(jù)精細化運營和精準(zhǔn)營銷服務(wù)的基礎(chǔ)。它是一種勾畫目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計方向的有效工具。在大數(shù)據(jù)的時代下,用...
在剛邁入數(shù)據(jù)的大門時,我經(jīng)常對一些數(shù)據(jù)指標(biāo)或者數(shù)據(jù)本身的概念很模糊,尤其是當(dāng)跟運營、數(shù)據(jù)分析師扯需求的時候,會被這些密密麻麻的指標(biāo)給弄糊涂。為了...
說明 ▍ 子查詢:嵌套在其他查詢中的查詢; ▍ 組合查詢(復(fù)合查詢 / 并操作):執(zhí)行多次查詢,多條select語句,并將結(jié)果作為單個查詢結(jié)果返...
一、聚合函數(shù) 對一組值進行計算,并返回單個值,也被稱為組函數(shù); 聚合計算過程:選定分組字段 – 分組 – 計算:1.選定分組字段:在 selec...
一、字段處理函數(shù) 字符串處理函數(shù):concat(field1,field2 …… )substr(str,pos,len)replace(str...