當(dāng)我們拿到一批規(guī)范的數(shù)據(jù)時(shí),首先要做的是對(duì)這批數(shù)據(jù)有個(gè)初步的了解。這個(gè)過(guò)程不僅是了解數(shù)據(jù)的過(guò)程,也是數(shù)據(jù)向我們描述的過(guò)程,一不小心就會(huì)被它花了眼。
一般描述指標(biāo)
- 算數(shù)平均值
拿到一批數(shù)據(jù),急于了解這批數(shù)據(jù)的情況,很多人是會(huì)選擇去看平均值(準(zhǔn)確說(shuō)是算數(shù)平均值)。比如一個(gè)月的日gmv,看整體情況會(huì)選擇用日均值gmv代替整體情況。
舉個(gè)栗子:3月的日均值gmv是10萬(wàn),2月的日均值gmv是8萬(wàn),從均值的角度看整體就是在上升的。
- 中位數(shù)
中位數(shù)就是排序在最中間的數(shù)字。舉例 將某日11名用戶的購(gòu)買金額進(jìn)行排序,排序在6的用戶的購(gòu)買金額就是這11個(gè)人的購(gòu)買金額中位數(shù)。如果排序是偶數(shù)個(gè),就取排序最中間的兩個(gè)數(shù)字的算數(shù)平均值作為中位數(shù)。中位數(shù)用在什么場(chǎng)景下呢?
舉個(gè)栗子:要看11個(gè)用戶的整體購(gòu)買均值,前10個(gè)用戶的金額都分布在1000~2000之間,低11個(gè)用戶的金額是20000,這個(gè)時(shí)候使用算數(shù)平均值的話整體的水平都被第11個(gè)人拉高了 跑偏了,算出來(lái)的算數(shù)平均值會(huì)在4000左右,這樣就因?yàn)橐粋€(gè)異常值而偏離了大部分的數(shù)據(jù)。
所以使用中位數(shù)主要避免異常值的影響,如果數(shù)據(jù)差異較大時(shí)可以選擇中位數(shù)作為參考。
- 眾數(shù)
眾數(shù)就是出現(xiàn)最多的數(shù)字。 - 加權(quán)平均值
加權(quán)平均值主要用在做績(jī)效衡量或者綜合評(píng)估的時(shí)候。比如在互聯(lián)網(wǎng)金融行業(yè)里有個(gè)指標(biāo)就是加權(quán)平均后過(guò)的,年化投資金額。
年化金額=金額*期限/12,就是涉及一個(gè) 不同的數(shù)值在結(jié)果中占的權(quán)重不同,而最后的結(jié)果是將權(quán)重求和后的結(jié)果。
數(shù)據(jù)穩(wěn)定性
一般用 方差來(lái)衡量數(shù)據(jù)的穩(wěn)定性,也就數(shù)據(jù)的波動(dòng)情況。
舉個(gè)栗子:2月的日均值gmv是10000,3月的日均值gmv也是1000。如果看到整體均值是一致的,就可以說(shuō)2月和3月的業(yè)務(wù)情況沒(méi)有變化嗎?
很顯然,上圖中均值都是一致的,但是波動(dòng)差異很大,這個(gè)時(shí)候就要重點(diǎn)關(guān)注3月的變化了。
在這個(gè)地方要強(qiáng)化一個(gè)認(rèn)知,不僅指標(biāo)的數(shù)值是需要關(guān)注的重點(diǎn),指標(biāo)是否穩(wěn)定也是需要關(guān)注的點(diǎn)。既要關(guān)注指標(biāo)結(jié)果還要關(guān)注的指標(biāo)的波動(dòng)變化。
再舉個(gè)栗子:兩個(gè)射擊運(yùn)動(dòng)員A和B,A的訓(xùn)練成績(jī)的算數(shù)平均值是 8,方差是1,B的訓(xùn)練成績(jī)的算數(shù)平均值是9,方差是2。這個(gè)時(shí)候應(yīng)該派誰(shuí)去參加比賽呢?
這個(gè)時(shí)候要考慮的是應(yīng)用的場(chǎng)景,如果參賽的其他隊(duì)員的水平都低于本隊(duì),就派A去參加。雖然A的均值沒(méi)有B高,但是A發(fā)揮穩(wěn)定,成績(jī)不會(huì)有較大的波動(dòng),再加上其他隊(duì)的水平在本隊(duì)之下,參賽的勝算會(huì)比較大。如果本隊(duì)的水平一般,就派B去,雖然B的方差較大成績(jī)不穩(wěn)定,但是B的均值較高,派B去雖然可能成績(jī)會(huì)波動(dòng),但是沖擊高分的成績(jī)也比較大。
數(shù)據(jù)描述還屬于數(shù)據(jù)認(rèn)知的初步階段,在Execl中可以使用 描述統(tǒng)計(jì) 功能來(lái)做初步的描述。


我的tableau public:yangliang的tableau public主頁(yè)