數(shù)據(jù)之路



概述

導(dǎo)讀

搭建數(shù)據(jù)指標(biāo)體系

業(yè)務(wù)理解

核心指標(biāo)

業(yè)務(wù)指標(biāo)

AARRR

漏斗轉(zhuǎn)化

數(shù)據(jù)建設(shè)

數(shù)據(jù)埋點(diǎn)

數(shù)據(jù)上報(bào)&格式設(shè)計(jì)

埋點(diǎn)類型

上報(bào)策略

安全性

數(shù)據(jù)清洗

python

sql

hive

hadoop

報(bào)表建設(shè)

指標(biāo)確定

數(shù)據(jù)計(jì)算

可視化

權(quán)限管控

例行監(jiān)控

日志監(jiān)控

傳輸監(jiān)控

計(jì)算任務(wù)

指標(biāo)異常

短信郵件提醒

編程相關(guān)


python基礎(chǔ)

numpy

pandas

數(shù)據(jù)etl

數(shù)據(jù)可視化

數(shù)據(jù)分析


方法論

- PEST分析法

- SWOT分析法

- 5W2H分析法

- 4P理論

- AARRR

分析方法

趨勢分析

對(duì)比分析

交叉分析

維度拆解

漏斗分析

留存分析

用戶分群

AB測試

競品分析

問題排查

埋點(diǎn)策略

- 上報(bào)時(shí)機(jī)

- 實(shí)時(shí)狀況

- 場景覆蓋

數(shù)據(jù)清洗

日志丟失

統(tǒng)計(jì)口徑


數(shù)據(jù)挖掘


構(gòu)建模型

- 分類與預(yù)測:回歸分析、決策樹、貝葉斯、SVM、神經(jīng)網(wǎng)絡(luò)

- 聚類分析:k-means、k-中心點(diǎn)

- 關(guān)聯(lián)分析

- 時(shí)間序列分析:ar、ma、arma、arima

案例分析


目標(biāo)定義

數(shù)據(jù)采集

數(shù)據(jù)清洗

構(gòu)建模型

- 分類:輸出類別

- 回歸:輸出數(shù)值

- 聚類:描述型

模型評(píng)估

模型部署

效果評(píng)估

分析報(bào)告

總結(jié)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容