《數(shù)據(jù)化運營速成手冊》,作者胡晨川,第三章:數(shù)據(jù)圖表進階

這一章作者繼續(xù)了圖表的話題,講述了一些稍微高級的圖表技巧,這里簡單整理一些我感覺實用些的內(nèi)容。
作者把數(shù)據(jù)分析師比作廚師,我想那整個數(shù)據(jù)行業(yè)就算是廚房了,工作這些年也算是在廚房中工作了好久,一開始做做擺盤,后來開始洗菜,再然后開始買菜選菜切菜,而今開始站在案板面前做一道菜了,認認真真的做一道菜。
做數(shù)據(jù)分析,做數(shù)據(jù)圖表的第一步是了解拿到的數(shù)據(jù),了解數(shù)據(jù)中有哪些指標、哪些維度,數(shù)據(jù)質(zhì)量如何。
如何選擇圖表,可以參考下圖(網(wǎng)上找的)

坐標軸
關于坐標軸,作者提到了幾個注意點,怎樣判斷一個坐標軸是否合理:
- 是否展現(xiàn)出了足夠的差別
- 它的范圍是否大于數(shù)據(jù)序列的4倍標準差。
關于4倍標準差這個點,我是沒有注意過,這里的為了設置坐標軸范圍,讓它更合理,使用Excel中的函數(shù)STDEV.P()
網(wǎng)格線
網(wǎng)格線的意義到底是什么?這個問題的確沒有認真思考過,我想就是為了更方便的找到對應的數(shù)據(jù)值吧,如果已經(jīng)標注了數(shù)據(jù)標簽,就可以不要網(wǎng)格線
輔助線

Excel中可以很方便的插入趨勢線,主要用來輔助判斷數(shù)據(jù)變動趨勢
還有一些類似漲跌線、垂直線、誤差線等,還有標注線。
線性趨勢線實質(zhì)上就是一條一元一次的線性回歸方程,它表示兩組數(shù)據(jù)間的線性關系,即“隨著一個變量的增長,另一個變量怎么變?”
不是所有的趨勢線都是有意義的,不能單看回歸公式,還要看R方值是否夠大,一般只有在R的平方值大于0.6的時候,才認為回歸公式是有意義的,代表了回歸公式對現(xiàn)實數(shù)據(jù)的可解釋度。
如:R平方值是0.0184,表示兩組數(shù)據(jù)間的關系只有1.8%的信息可以用回歸公式來解釋。
作者這里提到了一個例子,我感覺挺好的,就是增加均值線和均值加減一個標準差的線,這樣可以看出波動的情況是否正常。
