數(shù)據(jù)之美 · 屠夫的數(shù)據(jù)可視化三節(jié)課之三:可視化的思考

文:屠夫1868

歡迎關(guān)注:基業(yè)長(zhǎng)紅

轉(zhuǎn)載需獲本人授權(quán),并注明作者和出處


金錢(qián)永不眠,屠夫問(wèn)候各位早安。


一連三周的數(shù)據(jù)可視化系列在今天將迎來(lái)尾聲,在此之前我們先回顧一下上周《可視化的使用》為大家介紹的「D·R·C·C·T」:

Distribution · 分布:展現(xiàn)數(shù)據(jù)的分布情況,是洞察的基礎(chǔ)

Relationship · 關(guān)系:表達(dá)數(shù)據(jù)之間的關(guān)系,突出的是關(guān)聯(lián)

Comparison · 比較:對(duì)比數(shù)據(jù)的不同表現(xiàn),重點(diǎn)的是差異

Composition · 構(gòu)成:呈現(xiàn)數(shù)據(jù)內(nèi)部的成分,關(guān)注的是比例

Trend · 趨勢(shì):考慮數(shù)據(jù)隨時(shí)間、流程等維度變化的情況


這5個(gè)大類(lèi),既是可視化輔助表達(dá)的5種【目的】,也是可視化輔助推理的5種【思路】。

無(wú)論是將可視化用在結(jié)果表達(dá)還是過(guò)程分析,充分理解DRCCT,有助于我們?cè)谶x取可視化方案時(shí)有的放矢。

『數(shù)據(jù)可視化三節(jié)課』的最后一節(jié)課里,屠夫想分享自己對(duì)數(shù)據(jù)可視化的一些思考。



01 ?點(diǎn)與線


散點(diǎn)圖是最基礎(chǔ)的可視化方案之一,很多人卻把它用得很單調(diào)。

如果把“點(diǎn)”和“線”結(jié)合起來(lái),往往會(huì)有奇效,比如說(shuō)趨勢(shì)線:

來(lái)源:ECharts官方實(shí)例


除此之外,使用直線進(jìn)行標(biāo)注,也能讓散點(diǎn)圖的信息量大為豐富。

比如下面的例子里,標(biāo)注出男女樣本的平均值、最大值和最小值后,兩個(gè)群體的差異一目了然:

來(lái)源:ECharts官方實(shí)例



02 ?線與面

人眼對(duì)長(zhǎng)度的敏感性高于面積。

還是上次的例子,同樣想對(duì)比A~E這5類(lèi)的數(shù)量多寡,上方的餅圖就遠(yuǎn)不及下方的柱狀圖。

所以,想使用可視化的「比較」功能時(shí),請(qǐng)盡量使用直線元素。

來(lái)源:圖之典·柱狀圖


另外,由于面積比長(zhǎng)度高出一個(gè)維度,會(huì)放大了可視化方案中的差異,這樣的情況可能發(fā)生在氣泡圖和南丁格爾玫瑰圖里。

在使用氣泡圖時(shí),屠夫通常將數(shù)值開(kāi)平方后再作為氣泡半徑,讓 x=2a 的氣泡面積正好是 x=a 的兩倍,成比例地反映數(shù)值差異。

而南丁格爾玫瑰圖本來(lái)就是為了放大差異、突出比較的,一般不做這樣的處理,但是會(huì)向圖表使用者說(shuō)明情況。

比如下面的例子中,上海 (500+) 和北京 (200+) 在視覺(jué)上差了不止一倍,因?yàn)樽髡哌x取半徑長(zhǎng)度代表店鋪數(shù)量,而扇形面積卻和半徑的平方成正比:

來(lái)源:唐也欽,DT財(cái)經(jīng) (by 圖之典·南丁格爾玫瑰圖)



03 ?面與點(diǎn)


散點(diǎn)圖可能是最被低估的一種可視化方案,落到“面”上的“點(diǎn)”其實(shí)可以做很多文章。

通過(guò)控制散點(diǎn)的顏色深淺和半徑大小,全球最繁華的區(qū)域一目了然:

來(lái)源:ECharts官方實(shí)例


將點(diǎn)的移動(dòng)軌跡 (飛線) 鋪到地圖上,又成了非常精彩的航線圖:

來(lái)源:ECharts官方實(shí)例


04 ?系列和堆疊

使用柱狀圖和折線圖時(shí),我們可以通過(guò)“系列”將多個(gè)樣本群體放在同一個(gè)坐標(biāo)系下,起到「比較」的作用:

來(lái)源:ECharts官方實(shí)例


對(duì)于區(qū)域圖 (折線下的區(qū)域用顏色填充) ,將多個(gè)系列【堆疊】在一起,可以在「趨勢(shì)」和「比較」之余,額外展示「構(gòu)成」:

來(lái)源:ECharts官方實(shí)例



05 ?下鉆和上卷


數(shù)據(jù)分析繞不開(kāi)數(shù)據(jù)粒度問(wèn)題,通常來(lái)說(shuō),可視化只能表達(dá)一個(gè)粒度的數(shù)據(jù)。

比如按年、按月、按周、按天匯總的營(yíng)收數(shù)據(jù),通常會(huì)分開(kāi)在不同的圖表。

但是,我們可以通過(guò)「下鉆」和「上卷」將不同粒度的數(shù)據(jù),整合在一個(gè)可視化作品里。

比如下面旭日?qǐng)D的例子,點(diǎn)擊第1層分類(lèi) (設(shè)計(jì)/社科/心理……) ,可以觸發(fā)「下鉆」,旭日?qǐng)D變形至以第1層作為整體再展示向下層級(jí)的比例構(gòu)成。

這個(gè)例子不但可以再向下延伸 (第2層是星級(jí),3/4/5星),如果點(diǎn)擊旭日?qǐng)D正中央的圓,則會(huì)觸發(fā)「上卷」,將數(shù)據(jù)粒度往上一層:

來(lái)源:ECharts官方實(shí)例



06 ?時(shí)間軸


不同于平面圖表和數(shù)據(jù)大屏,BI (商業(yè)智能) 可以通過(guò)一些交互組件實(shí)現(xiàn)“超維度”的效果。

比如下面的氣泡圖,原本只能展現(xiàn)3個(gè)維度的信息:人均收入 (橫軸) 、平均壽命 (縱軸) 和總?cè)丝?(半徑)。

但是增加一條時(shí)間軸后,就可以額外增多一個(gè)維度 —— 時(shí)間 —— 大大強(qiáng)化了「對(duì)比」和「趨勢(shì)」的功能:

來(lái)源:ECharts官方實(shí)例


07 ?在線和離線


屠夫在工作中曾考慮過(guò)這么一個(gè)問(wèn)題:

如果一款BI的在線可視化足夠靈活和強(qiáng)大,

那么它還有必要提供離線報(bào)表導(dǎo)出功能嗎?

答案是肯定的,原因很簡(jiǎn)單:

為了突出重點(diǎn),可視化必定省略了一部分元素。


三節(jié)課里屠夫舉的所有例子,都是為了突出數(shù)據(jù)集的某些特征,而有選擇性地進(jìn)行展示。

但是對(duì)于有一定分析經(jīng)驗(yàn)的人來(lái)說(shuō),可視化方案會(huì)限制了他們的觀察角度,遠(yuǎn)不如離線報(bào)表自由。

比如說(shuō),可視化方案中的數(shù)據(jù)波動(dòng)有明顯周期性,有經(jīng)驗(yàn)的分析師可能會(huì)導(dǎo)出離線報(bào)表,計(jì)算一下移動(dòng)平均值,可以更準(zhǔn)確地看到平滑后的真實(shí)數(shù)據(jù)趨勢(shì)。

再比如說(shuō),可視化方案中的數(shù)據(jù)出現(xiàn)明顯異常,有經(jīng)驗(yàn)的數(shù)據(jù)使用者也可能會(huì)導(dǎo)出離線報(bào)表,嘗試通過(guò)IQR方法進(jìn)行數(shù)據(jù)清洗,才再進(jìn)行可視化。


在屠夫看來(lái),在線可視化和離線報(bào)表的差異,就好比“看紀(jì)錄片”和“親自旅游”。

前者是有人預(yù)設(shè)鏡頭,向你展現(xiàn)選定的畫(huà)面和場(chǎng)景;

后者是親臨其境,靠自己去探索、去體驗(yàn)、去嘗試。

紀(jì)錄片可以看,但親自旅游,少不了。


以上就是「數(shù)據(jù)之美 · 屠夫的數(shù)據(jù)可視化三節(jié)課」的第3節(jié)內(nèi)容,感謝你的耐心閱讀。

如果三節(jié)課對(duì)你有所啟發(fā),別忘了在下面點(diǎn)個(gè)【贊??】和【在看】哦!



參考和推薦


1本書(shū)籍 · 最簡(jiǎn)單的圖形與最復(fù)雜的信息

推薦理由

《華爾街日?qǐng)?bào)》前圖形設(shè)計(jì)總監(jiān)的代表作,書(shū)中介紹的圖表制作7大法則和7類(lèi)圖表的使用規(guī)范,可以幫你快速提升PPT圖表制作水平 (因?yàn)榧杏谄矫婵梢暬?。

除此之外,對(duì)于經(jīng)常需要閱讀數(shù)據(jù)圖表,或者經(jīng)常使用數(shù)據(jù)進(jìn)行決策的人來(lái)說(shuō),這本書(shū)也可以幫你繞開(kāi)視覺(jué)誤區(qū),避免被一些糟糕的可視化方案誤導(dǎo)。

獲取方式

購(gòu)買(mǎi)實(shí)體書(shū)或者電子書(shū)

書(shū)名:《最簡(jiǎn)單的圖形與最復(fù)雜的信息:如何有效建立你的視覺(jué)思維》

作者:[美] 黃慧敏 著,白顏鵬 譯


1個(gè)網(wǎng)站 · 圖之典

推薦理由

可視化方案的百科全書(shū),圖表的功能屬性、元素構(gòu)成、適用場(chǎng)景、設(shè)計(jì)案例等一應(yīng)俱全,甚至還包含BI工具和實(shí)現(xiàn)代碼庫(kù)!

無(wú)論是數(shù)據(jù)產(chǎn)品經(jīng)理,數(shù)據(jù)分析師還是前端可視化工程師,都可以收藏作為自己的可視化字典。

獲取方式

搜索“圖之典”


1個(gè)實(shí)例 · One Dataset, Visualized 25 Ways

推薦理由

同一個(gè)數(shù)據(jù)集,能玩出多少種可視化方案?

曾以為,不同可視化方案是針對(duì)不同數(shù)據(jù)集,這一個(gè)例子大大拓展了屠夫?qū)梢暬恼J(rèn)知邊界和想象力。

獲取方式

點(diǎn)擊文末“閱讀原文”

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容