數(shù)據(jù)分析
第一章 · 基本概念
什么是數(shù)據(jù)分析?
數(shù)據(jù)分析是指選用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,找到目標(biāo)對(duì)象并進(jìn)行分析,提取有用信息進(jìn)行研究并形成結(jié)論的過(guò)程。
關(guān)鍵詞
選用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法 根據(jù)實(shí)際分析需求選用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法
目標(biāo)對(duì)象 根據(jù)統(tǒng)計(jì)分析方法確定目標(biāo)對(duì)象
進(jìn)行分析 保證過(guò)程的準(zhǔn)確性
提取有用信息 排除干擾與無(wú)用信息,提取有用信息
深入研究 深入分析與研究
形成結(jié)論 弄清楚“說(shuō)明了什么問(wèn)題”
流程
選方法 --> 定對(duì)象 --> 做分析 --> 取信息 --> 細(xì)研究 --> 下結(jié)論
為什么要做數(shù)據(jù)分析?
C端思維
得到新用戶
維護(hù)老用戶
增加收益
B端思維
提高工作效率
提升用戶體驗(yàn)
案例
電商平臺(tái)的關(guān)注點(diǎn)
目的:盈利 - GMV = 成交量 x 客單價(jià) = 流量數(shù)量 x 轉(zhuǎn)化率 x 客單價(jià)
影響因素
流量數(shù)量
-
直接廣告
網(wǎng)站彈窗
靜態(tài)廣告
線下投放
-
間接廣告
微信公眾號(hào)
新浪微博
社區(qū)論壇
-
搜索引擎
- 競(jìng)價(jià)排名
-
消息推送
EDM
短信
APP PUSH
轉(zhuǎn)化率
-
引流
數(shù)量
質(zhì)量
-
詳情頁(yè)
內(nèi)容詳盡
有吸引力
-
下單流程
簡(jiǎn)單易懂
操作便捷
客單價(jià)
產(chǎn)品定價(jià)
優(yōu)惠促銷
商品推薦
轉(zhuǎn)化率:用戶操作路徑優(yōu)化
數(shù)據(jù)分析過(guò)程中隱存的風(fēng)險(xiǎn)
-
分析方案
- 數(shù)據(jù)分析方案選擇是否合理
-
數(shù)據(jù)來(lái)源
- 數(shù)據(jù)來(lái)源是否可靠
-
準(zhǔn)確性
- 分析過(guò)程是否準(zhǔn)確
第二章 · 數(shù)據(jù)分析常用工具
| 常見工具 | 能力體現(xiàn) | 學(xué)習(xí)成本 |
|---|---|---|
| Excel | 數(shù)據(jù)統(tǒng)計(jì)/分析與可視化呈現(xiàn) | 低 |
| SQL | 數(shù)據(jù)庫(kù)數(shù)據(jù)查詢 | 高 |
| 原生埋點(diǎn)/MTA | 用戶行為跟蹤與分析 | 中 |
第三章 · 常見的數(shù)據(jù)分析方法
第一節(jié) · 基礎(chǔ)數(shù)據(jù)分析
概念:通過(guò)簡(jiǎn)單易懂的數(shù)據(jù)統(tǒng)計(jì)與分析工作,了解數(shù)據(jù)中傳遞出的客觀規(guī)律,從而達(dá)到分析目的的一種簡(jiǎn)便方法。
基礎(chǔ)數(shù)據(jù)分析流程
-
明確目的
- 明確出于什么原因要做此次數(shù)據(jù)分析,目的是為了解決什么問(wèn)題或了解什么情況
-
數(shù)據(jù)采集
- 了解數(shù)據(jù)采集的基本方式,包括:數(shù)據(jù)庫(kù)抓取、埋點(diǎn)數(shù)據(jù)、訪談與調(diào)查問(wèn)卷等等
-
整理數(shù)據(jù)
- 數(shù)據(jù)整理是對(duì)源數(shù)據(jù)的系統(tǒng)加工,是數(shù)據(jù)分析工作的前置,包括:數(shù)據(jù)清洗,分類和整合
-
可視化呈現(xiàn)
- 將繁雜的數(shù)據(jù)表格基于觀察需求轉(zhuǎn)化為可視化圖表,可以更便于數(shù)據(jù)觀察與分析
-
分析總結(jié)
- 通過(guò)結(jié)果數(shù)據(jù)反映出來(lái)的客觀信息,分析出在起初計(jì)劃要解決的問(wèn)題或了解當(dāng)前某些業(yè)務(wù)相關(guān)情況
分析總結(jié)
-
看趨勢(shì)
通過(guò)觀察數(shù)據(jù)波動(dòng)情況,觀察目標(biāo)數(shù)據(jù)的走向趨勢(shì)情況,從而掌握樣本數(shù)據(jù)的異常情況以及客觀規(guī)律。
常用工具:趨勢(shì)圖、多列堆積柱形圖
-
看分布
通過(guò)觀察數(shù)據(jù)分布情況,觀察目標(biāo)數(shù)據(jù)再不同階段的聚合程度,為數(shù)據(jù)分析提供客觀依據(jù)。
常用工具:直方圖、箱線圖、正態(tài)分布、點(diǎn)圖、柏拉圖
-
看對(duì)比
通過(guò)觀察兩組或多組數(shù)據(jù)的對(duì)比情況,觀察數(shù)據(jù)組間相近或差異較大的數(shù)據(jù)區(qū)間。
常用工具:折線圖、堆積柱形圖、相關(guān)與回歸分析等
數(shù)據(jù)對(duì)比:平行比較、同比數(shù)據(jù)、環(huán)比數(shù)據(jù)
第二節(jié) · 用戶模型分析
什么是用戶模型?
用戶模型是對(duì)業(yè)務(wù)目標(biāo)群體真實(shí)特征及屬性的勾勒,是真實(shí)用戶的虛擬代表。
目的:盡量減少主觀臆測(cè),了解他們的真實(shí)需求,從而知道如何更好的為不同類型用戶提供定制化服務(wù)。
兩種構(gòu)建用戶模型的方法
| 類型 | 方法 | 特點(diǎn) |
|---|---|---|
| 傳統(tǒng)用戶模型 | 通過(guò)對(duì)用戶的訪談和觀察等方法,得到目標(biāo)信息 | 準(zhǔn)確度高,但成本高 |
| 臨時(shí)用戶模型 | 通過(guò)行業(yè)專家或公開的市場(chǎng)調(diào)查數(shù)據(jù)來(lái)快速建模 | 準(zhǔn)確度低,易偏頗,但成本低 |
兩者可以結(jié)合,先通過(guò)經(jīng)驗(yàn)或?qū)<乙庖娊⒁粋€(gè)初始用戶模型,之后再進(jìn)行訪談或觀察等方法來(lái)佐證和調(diào)整。
用戶模型的執(zhí)行流程

信息整理
方法:找共性,看差異
“共性”用來(lái)總結(jié)該群體的特征
“差異”用來(lái)論證分類的合理性
第三節(jié) · 事件觸發(fā)模型分析
什么是埋點(diǎn)
埋點(diǎn):通過(guò)程序來(lái)記錄用戶與產(chǎn)品交互過(guò)程的相關(guān)數(shù)據(jù)

事件:用戶在產(chǎn)品上的行為所獲得的程序反饋。
埋點(diǎn)的作用
通過(guò)了解用戶與產(chǎn)品的交互過(guò)程,來(lái)幫助產(chǎn)品決策、推動(dòng)產(chǎn)品優(yōu)化以及指導(dǎo)運(yùn)營(yíng)。

載體:買點(diǎn)包括在iOS、Andriod、H5、小程序等前端埋點(diǎn),也包括后端業(yè)務(wù)埋點(diǎn)。
埋點(diǎn)的類型
-
基礎(chǔ)埋點(diǎn)
-
頁(yè)面訪問(wèn)數(shù)量(看總體趨勢(shì),預(yù)警,活動(dòng)有效性分析)
- PV、UV
頁(yè)面停留時(shí)長(zhǎng)(內(nèi)容是否完整看完)
-
-
全局埋點(diǎn)
- 全量埋點(diǎn)說(shuō)明文檔
-
關(guān)鍵數(shù)據(jù)埋點(diǎn)
廣告位點(diǎn)擊統(tǒng)計(jì)
推薦商品點(diǎn)擊統(tǒng)計(jì)
全局埋點(diǎn) - 全量埋點(diǎn)說(shuō)明文檔示例:
| 序號(hào) | 頁(yè)面名稱 | pageKey | 動(dòng)作名稱 | actionKey |
|---|---|---|---|---|
| 1 | 登錄首界面 | login_first_page | 點(diǎn)擊開啟學(xué)習(xí)之旅 | click_openstudy |
| 2 | 點(diǎn)擊勾選協(xié)議 | click_tick | ||
| 3 | 點(diǎn)擊協(xié)議 | click_agreement | ||
| 4 | 協(xié)議頁(yè)面 | agreement_page | 點(diǎn)擊返回 | click_back |
| 5 | 點(diǎn)擊我知道了 | click_iknow | ||
| ... | ... | ... | ... | ... |
優(yōu)點(diǎn):
數(shù)據(jù)量完整且全面
便于多維度分析
不足:
開發(fā)成本較高
前端工作壓力大
關(guān)鍵數(shù)據(jù)埋點(diǎn)
通過(guò)指定數(shù)據(jù)埋點(diǎn)、取數(shù)。統(tǒng)計(jì)及分析,可以更有針對(duì)性的進(jìn)行數(shù)據(jù)觀察。
第四節(jié) · 漏斗分析模型
什么是漏斗分析模型
漏斗分析模型是用來(lái)觀察用戶在使用產(chǎn)品過(guò)程中,多個(gè)關(guān)鍵行為之間的轉(zhuǎn)化與流失。
漏斗模型的價(jià)值
有助于精細(xì)化運(yùn)營(yíng)&設(shè)計(jì)。
構(gòu)建方式
-
整理目標(biāo)結(jié)構(gòu)框架
創(chuàng)建步驟:
- 明確觀察目標(biāo)
- 整理全部可觸達(dá)目標(biāo)頁(yè)面的“入口”,即為流量流入
- 梳理核心路徑。標(biāo)定首要觀察的路徑
- 梳理可能存在的跳轉(zhuǎn)“出口”,即為流失
- 使用腦圖勾畫出整體結(jié)構(gòu)框架
選定待分析路徑
-
確定相關(guān)參數(shù)變量
- 用戶類型,包括:全量用戶、活躍用戶、普通會(huì)員用戶、鉆石會(huì)員用戶、普通用戶
- 時(shí)間段,包括:日、月、季度、半年、一年和自定義。
-
數(shù)據(jù)觀察與比較
- 整體觀察:關(guān)注轉(zhuǎn)化的衰減情況,觀察“陡減”區(qū)間
- 數(shù)據(jù)比較:不同變量同樣路徑間比較,觀察數(shù)據(jù)差異
第五節(jié) · 留存分析模型
什么是留存分析模型?
用來(lái)了解不同類型用戶的參與量以及活躍程度的分析模型,涉及核心業(yè)務(wù)流程以及運(yùn)營(yíng)活動(dòng)。
關(guān)鍵詞:
參與量:觀察不同時(shí)間點(diǎn)或不同時(shí)間段中,用戶的參與數(shù)量。
活躍程度:關(guān)注單位群體在平臺(tái)中的“依賴”程度(黏性)。
核心業(yè)務(wù)流程:產(chǎn)品“主線”。
運(yùn)營(yíng)活動(dòng):以平臺(tái)為基礎(chǔ),發(fā)起的伴有不同目的的組織形式。
留存分析模型的價(jià)值
通過(guò)留存分析模型分析產(chǎn)品對(duì)用戶的黏性,是評(píng)價(jià)產(chǎn)品對(duì)用戶是否有價(jià)值的重要依據(jù)。
-
基礎(chǔ)效用
評(píng)估產(chǎn)品挽留用戶能力(黏性)
-
診斷能力
檢驗(yàn)業(yè)務(wù)邏輯中的癥結(jié)所在
-
效果評(píng)估
評(píng)估產(chǎn)品迭代調(diào)優(yōu)的實(shí)際業(yè)務(wù)效果
如何計(jì)算近日留存量

第六節(jié) · 路徑分析模型
什么是路徑分析模型?
觀察某個(gè)人或某個(gè)樣本群體再訪問(wèn)產(chǎn)品或平臺(tái)時(shí),針對(duì)每個(gè)頁(yè)面和不同路徑的訪問(wèn)次數(shù)及順序進(jìn)行數(shù)據(jù)統(tǒng)計(jì)與分析的模型。
關(guān)鍵詞:
某個(gè)人:指?jìng)€(gè)體用戶
某個(gè)樣本群體:指在某種條件下的抽樣群體
次數(shù):訪問(wèn)頻次
順序:訪問(wèn)的先后順序
統(tǒng)計(jì)與分析:基于前期準(zhǔn)備,通過(guò)統(tǒng)計(jì)與分析得出結(jié)論
路徑分析模型的價(jià)值
全局路徑與流失節(jié)點(diǎn)觀察
-
了解個(gè)體及群體的整體路徑
通過(guò)對(duì)用戶使用路徑的觀察,可以了解用戶的使用習(xí)慣以及用戶是否可以很好的適應(yīng)各個(gè)流程鏈路
-
可視化流失節(jié)點(diǎn)
通過(guò)對(duì)各個(gè)遞進(jìn)頁(yè)面中數(shù)據(jù)衰減的觀察,分析流失原因,制定優(yōu)化方案。
分析方法
-
產(chǎn)品結(jié)構(gòu)/框架/功能拆解
- 梳理結(jié)構(gòu)框架,基于用戶使用流程進(jìn)行功能拆解
-
路徑選定
- 基于數(shù)據(jù)觀察的目的選定目標(biāo)路徑
-
數(shù)據(jù)統(tǒng)計(jì)與分析
- 觀察數(shù)據(jù)遞增與衰減情況,橫向?qū)Ρ?,根?jù)差異分析問(wèn)題所在
第七節(jié) · 分布分析模型
什么是分布分析模型?
概念:對(duì)用戶在平臺(tái)中的消費(fèi)頻次、金額或活躍程度等行為進(jìn)行分類分析的模型。
價(jià)值:
挖掘用戶分布規(guī)律,優(yōu)化產(chǎn)品及運(yùn)營(yíng)策略
核心用戶篩選與分類,需求定制化
RFM分析模型
RFM主要根據(jù)客戶活躍程度和平臺(tái)交易金額貢獻(xiàn)所做的分類。
近度:Recency,用字母R表示,代表客戶最近一次的活躍距離目前的天數(shù)。在這部分客戶中,有些優(yōu)質(zhì)客戶值得通過(guò)一定的有效手段進(jìn)行激活。
頻度:Frequency,用字母F表示,代表客戶過(guò)去某段時(shí)間內(nèi)的活躍頻率。針對(duì)消費(fèi)頻度較小且消費(fèi)額較大的客戶,可以推行一些運(yùn)營(yíng)策略刺激用戶,增加消費(fèi)頻次。
額度:Monetary,用字母M表示,代表客戶最近一次消費(fèi)金額或某個(gè)時(shí)間段內(nèi)平均消費(fèi)金額。通過(guò)該項(xiàng)指標(biāo)可以評(píng)估不同消費(fèi)水平的用戶分布情況。
| 類別 | R | F | M | 策略 |
|---|---|---|---|---|
| 重要價(jià)值用戶 | 高 | 高 | 高 | 保持現(xiàn)狀 |
| 重要發(fā)展用戶 | 高 | 低 | 高 | 提升頻次 |
| 重要保持用戶 | 低 | 高 | 高 | 激活用戶 |
| 重要挽留用戶 | 低 | 低 | 高 | 重點(diǎn)召回 |
| 一般價(jià)值用戶 | 高 | 高 | 低 | 刺激消費(fèi) |
| 一般發(fā)展用戶 | 高 | 低 | 低 | 挖掘需求 |
| 一般保持用戶 | 低 | 高 | 低 | 流失召回 |
| 一般挽留用戶 | 低 | 低 | 低 | 放棄維護(hù) |

搭建步驟
-
數(shù)據(jù)抓取
- 通過(guò)編寫SQL或研發(fā)人員協(xié)助取得待分析數(shù)據(jù)
-
定義區(qū)間
- 基于基礎(chǔ)數(shù)據(jù)的分布情況,定義分析區(qū)間
-
RFM取值
- 對(duì)照“定義區(qū)間表”填寫RFM的對(duì)應(yīng)值
-
水平定義
- 基于RFM均值定義“高低”水平
-
用戶分層
- 定義用戶類型,將系統(tǒng)類型用戶合并分析
-
策略制定
- 針對(duì)不同類型用戶制定相應(yīng)策略