時間序列分析 - 基礎(chǔ)知識與分析場景(Time series analysis)

在所有的可視化儀表板中,和時間相關(guān)的圖表是最常見的。除了最基本的折線圖外,我們還有很多方式來呈現(xiàn)和分析時間序列的數(shù)據(jù)。

時間序列的模式(Time series patterns)

在開始探查分析前,我們需要先確定時間序列的模式。

常見的模式有:

  • 趨勢性(Trend):數(shù)據(jù)隨時間變化的呈整體上升或下降的趨勢。
  • 季節(jié)性(Seasonal):數(shù)據(jù)在每年的特定季度、月份、周、日的數(shù)據(jù)波動。
  • 周期性(Cyclic)數(shù)據(jù)存在不固定頻率的上升和下降時,表示該序列有周期性,通常與商業(yè)活動有關(guān)。

很多時候時間序列會同時包含趨勢、季節(jié)以及周期性。

image.png

美國新建房屋銷售額表現(xiàn)出強(qiáng)烈的年度季節(jié)性,以及周期為6~10年的周期性。同時數(shù)據(jù)并沒有表現(xiàn)出明顯的趨勢性。

image.png

柏林的游客數(shù)據(jù)同時包含了趨勢性季節(jié)性,即總的游客數(shù)量是穩(wěn)步上升的,同時又有明顯的季節(jié)性。

image.png

為了更清楚的看到季節(jié)性的分布,我們可以將多年的數(shù)據(jù)對齊到以月的方式查看。

時間的粒度/級別

不借助外部儀器,人類的極限反應(yīng)速度可以到100毫秒。在科學(xué)分析場景,如物理學(xué),時間精度可以更高。在商業(yè)分析場景,一般拿到的數(shù)據(jù)粒度會以:年、季度、月、周、日、小時 居多。細(xì)粒度的時間可以向上聚合到粗粒度的,比如:拿到的是去年每一天的銷售額數(shù)據(jù),但作為年度的總結(jié),只要看每個月的銷售額即可。

時間的連續(xù)與離散

連續(xù)的時間:

等間距,一個接一個的。如3月1日、3月2日、3月3日、一直到 3月15日每天的數(shù)據(jù)。如果缺了某幾天的數(shù)據(jù),在時間軸上仍然會保留對應(yīng)的位置。

image.png

離散/序數(shù)的時間:

假設(shè)我們想看一周中每天的銷售表現(xiàn),這時可以從連續(xù)的時間中,提取出離散的周幾時間來進(jìn)行分析。

image.png

在具體分析時,我們一般還會區(qū)分下工作日與周末,并分別看平均值。

image.png

帶著問題去分析

當(dāng)前相比過去的變化

總結(jié)過去,展望未來。我們總是希望知道當(dāng)前相比過去的變化。

image.png

以各個地區(qū)在過去幾年銷售額的變化為例,我們可以看到6個地區(qū)詳細(xì)到每個月的銷售額數(shù)據(jù),但當(dāng)我們想知道相比過去是否有增長或哪個地區(qū)的增長最快時,就沒法看清了。

image.png

這個時候,可以通過斜率圖(slopegraphs)來更好的分析與呈現(xiàn),具體做法是只保留頭尾時間的數(shù)據(jù),然后用折線圖來呈現(xiàn),為了更容易發(fā)現(xiàn)上升下降,還可以用顏色來區(qū)分。

某個時間點(diǎn)前后的比較

從假設(shè)分析(What-If Analysis)的角度,我們會關(guān)心如果在某個時間點(diǎn)做了某個行動所帶來的收益。

以買房為例,我們會關(guān)心如果我在某個時間點(diǎn)買了房,那么截止到當(dāng)前的漲幅變化,以及相比更早的時間的變化。

image.png

image.png

這個是紐約的房價變化圖,如果在2012年買入,那么到了2017時,會有21%的漲幅。而如果是在2006年的高點(diǎn)購入,則只有6%的漲幅。在做這樣的假設(shè)分析時,我們一般會允許用戶指定時間參數(shù),以更靈活的分析前后的變化。

如何查看排名變化

相比過程本身,人們更容易關(guān)注結(jié)果。

image.png
image.png

假設(shè)我們有不同類別的商品在銷售,每年的銷售額穩(wěn)步上升,除了關(guān)心具體的收入外,我們還想知道各個類別的排名變化。如果通過顏色來細(xì)分各個類別的銷售額,雖然也可以看出一些排名變化,但還是會不直觀。

image.png

image.png

這時我們可以先計算每年的銷售額排名,然后用排名變化圖(Bump Chart)來呈現(xiàn)。相比銷售額隨時間的大幅波動,排名變化圖可以讓你更好的聚焦于關(guān)心的點(diǎn)。

不同事件的增長速度

以玩具總動員三部曲為例,這3部電影發(fā)行于不同的年份,也都獲得了很高的收入。

image.png

如果只看累計的票房收入,我們可以知道第二部的表現(xiàn)最好。但如果我們想知道這幾部電影從首映日開始的增長變化或火爆程度就沒法看出了。

image.png

從這個圖上我們可以按周看發(fā)生在不同年份的,三部曲的每周票房收入。

image.png

更好的方式把時間對齊到一個公共基準(zhǔn)點(diǎn)來查看分析,而不是查看一段絕對時間范圍的數(shù)據(jù)。按星期看自首映日開始的總收入,就更容易比較增長曲線了。

如何分析事件的持續(xù)時間

在項目管理的場景,一個項目會拆分為多個可以并行或有前后依賴關(guān)系的任務(wù)。

image.png

為了查看總的用時,以及同時進(jìn)行的任務(wù),我們可以用甘特圖(Gantt charts)來呈現(xiàn)和分析。這兒的205天是整個項目的用時。如果要算人天成本,可以把這兒的每個任務(wù)的用時加起來,即投入了4個人,總的人天是:292。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容