數(shù)據(jù)可視化

原文鏈接:https://www.phyet.com/data-visualization

引言:數(shù)據(jù),于我,非本業(yè)也;所謂無知少年勇赴約,又得彎腰不眠夜。今事畢已近半載,提筆良久不敢落。溫故知新,我性使然;小作整理,權(quán)當(dāng)入門之鑒;喻,汝若欲練此功,吾僅告知必先自宮。

數(shù)據(jù)可視化,官方釋義,是關(guān)于數(shù)據(jù)之視覺表現(xiàn)形式的研究;旨在借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。話不多說,例之:

此即為數(shù)據(jù)可視化。

因果相傳,凡事都講問個(gè)why?如前文所述,為什么要做數(shù)據(jù)可視化呢,主要目的在于期望能夠通過圖形化的手段,來更清晰有效的進(jìn)行信息的傳達(dá)和溝通,再例之:

此即為什么要做數(shù)據(jù)可視化,簡述,一言以蔽之。

書歸正傳,在明白了什么是數(shù)據(jù)可視化以及弄清楚了為什么要做數(shù)據(jù)可視化之后,事情便自然的發(fā)展成為了怎么去做數(shù)據(jù)可視化。而工欲善其事,必先利其器,so接下來對于數(shù)據(jù)可視化中的各種圖表一一說明,如下:

柱狀圖

柱狀圖可謂司空見慣,總結(jié)起來,其主要用于二維數(shù)據(jù)集合的可視化表現(xiàn)(可以理解為每個(gè)數(shù)據(jù)點(diǎn)均包括x和y在內(nèi)的兩個(gè)數(shù)值),但通常只有一個(gè)數(shù)據(jù)維度需要進(jìn)行比較;如下圖:

折線圖

折線圖與柱狀圖類似,均用以表現(xiàn)二維數(shù)據(jù)集合;區(qū)別在于,折線圖更適合用以數(shù)據(jù)量級比較大的二位數(shù)據(jù)集,尤其對于需要突出數(shù)據(jù)整體趨勢而非單個(gè)數(shù)據(jù)點(diǎn)的場合,如下:

當(dāng)然,折線圖的另一個(gè)特點(diǎn)還在于其可用于多組二維數(shù)據(jù)的展示,如下圖:

餅圖

筆者鄙視餅圖已久。簡而言之,餅圖是邪惡的。因?yàn)槿说娜庋蹖τ诿娣e的大小不是特別敏感,例:

上圖的餅圖展示的是A、B、C和D四個(gè)供應(yīng)商的市場份額。但如果我們來簡單觀察一下—在圖中哪家供應(yīng)商的份額最大?可能大多數(shù)人會(huì)認(rèn)為正藍(lán)色對應(yīng)的供應(yīng)商 B 的市場份額看起來最大,但事實(shí)并非如此。而如果以柱狀圖以替之,效果會(huì)是如何呢,如下:

效果不言而喻,那么餅圖是否一無是處呢?可能有一個(gè)例外,就是反映部分和整體的比重時(shí),效果尚可。

散點(diǎn)圖

散點(diǎn)圖較前文所述的幾類圖表而言,其可用以表現(xiàn)三維數(shù)據(jù)集合,但其中只有兩維數(shù)據(jù)需要比較,并且尤其在展示兩件事的關(guān)系時(shí)更加有用。因?yàn)樯Ⅻc(diǎn)圖可以同時(shí)將數(shù)據(jù)對應(yīng)到x軸和y軸上,觀察其是否存在某種關(guān)系以及存在何種關(guān)系。散點(diǎn)圖在科學(xué)領(lǐng)域使用比較頻繁,但商業(yè)及學(xué)術(shù)領(lǐng)域中同樣有散點(diǎn)圖的用武之地,見下圖:

如上圖,假設(shè)我們管理公交車隊(duì),希望能理解行駛英里數(shù)與每英里成本之間的關(guān)系;并且假如我們想要重點(diǎn)關(guān)注每英里成本高于平均水平的情況,那么通過觀察可知,當(dāng)行駛英里數(shù)少于 1700 英里或者多于 3300 英里時(shí),每英里 成本會(huì)高于平均水平。稍作修改,效果可能會(huì)更好:

氣泡圖

氣泡圖其實(shí)是散點(diǎn)圖的一種變體,其通過每個(gè)點(diǎn)的面積大小來反映第三維數(shù)據(jù),如下圖所示,其描述的是卡特里娜颶風(fēng)的路徑,三個(gè)維度分別為經(jīng)度、緯度、強(qiáng)度。點(diǎn)的面積越大,就代表強(qiáng)度越大。因?yàn)橛脩舨簧朴谂袛嗝娣e大小,所以氣泡圖只適用不要求精確辨識第三維的場合。

而如果為氣泡加上不同顏色(或文字標(biāo)簽),氣泡圖就可用來表達(dá)四維數(shù)據(jù)。比如下圖就是通過顏色,表示每個(gè)點(diǎn)的風(fēng)力等級:

雷達(dá)圖

雷達(dá)圖所適用的數(shù)據(jù)維度通常為四維以上,且每個(gè)維度都是必須可以排序的。整體來看,面積越大的數(shù)據(jù)點(diǎn),表示其越重要。如NBA中對于首發(fā)五人的貢獻(xiàn)統(tǒng)計(jì),很顯然勒布朗·詹姆斯(紅色區(qū)域)是熱火隊(duì)最重要的選手:

以上,便為數(shù)據(jù)可視化中比較常用的幾種圖表形式。而如果想完成文初所示的綜合性數(shù)據(jù)可視化方案,卻遠(yuǎn)遠(yuǎn)不是簡單的將幾類數(shù)據(jù)圖表排列組合就能夠達(dá)成的。因?yàn)檎劦揭曈X溝通,最重要的便在于受眾感知的認(rèn)知負(fù)荷;即受眾付出多少精力才能夠提取出信息。而造成過度或者無關(guān)的認(rèn)知負(fù)荷的一個(gè)元兇就是本文所要提到的“雜亂”。那么我們要如何去識別圖形中的信號和雜聲呢,不妨嘗試使用“視覺認(rèn)知的格式塔原則”。

視覺認(rèn)知的格式塔原則

格式塔心理學(xué)派在 20 世紀(jì)初開始理解個(gè)體如何認(rèn)知周圍世界的規(guī)則。他們關(guān)于視覺認(rèn)知的原則定義了人們?nèi)绾闻c視覺刺激交互并建立規(guī)則,這在今天依然適用。下文簡單探討一下其包含的六大原則:臨近原則、相似原則、包圍原則、閉合原則、連續(xù)原則和連接原則。

臨近原則

我們傾向于認(rèn)為物理上臨近的物體屬于同一個(gè)群體。臨近原則下圖所示:根據(jù)點(diǎn)與點(diǎn)相互之間臨近與否,你會(huì)很自然地將這些點(diǎn)視為三個(gè)不同的群體。

我們可以將這一原則應(yīng)用到表格設(shè)計(jì)當(dāng)中。在下圖中,簡單地通過調(diào)整點(diǎn)與點(diǎn)之間的空白,你的眼睛會(huì)按預(yù)設(shè)的方向移動(dòng),左側(cè)圖中隨列向下,右側(cè)圖中則隨行向右。

相似原則

擁有相似顏色、形狀、大小或者方向的物體會(huì)被視作相關(guān)或從屬于一個(gè)群體。在下圖中, 你會(huì)很自然地將左圖中藍(lán)色的圓或者右圖中灰色的方塊聯(lián)系在一起:

這一原則也可以用于表格的設(shè)計(jì),幫助將受眾的目光聚焦到我們所期望的方向。在下中,顏色的相似性是讓我們按行閱讀(而非按列閱讀)的線索。這消除了使用邊框等額外元素 引導(dǎo)注意的需求。

包圍原則

我們會(huì)認(rèn)為物理上包圍在一起的物體從屬于同一個(gè)群體。不需要很明顯的包圍來達(dá)到這個(gè) 目的:淺色的背景通常就足夠了,正如下圖所示。

包圍原則的使用場景之一是為數(shù)據(jù)添加一個(gè)視覺上的區(qū)分,如下圖所示。

閉合原則

閉合的概念是指人們希望事情能夠簡化并符合腦海中已經(jīng)存在的結(jié)構(gòu)。因此人們傾向于將 一系列個(gè)體元素看作一個(gè)可識別的形狀——當(dāng)部分缺失時(shí),我們的視覺會(huì)幫助填充。例如下圖中的元素往往首先被看作一個(gè)圓,然后才是個(gè)體元素。

作圖應(yīng)用(如 Excel)通常默認(rèn)包含邊框、背景色等元素。閉合原則告訴我們這是沒有必要的——我們可以去掉這些元素,而圖形看起來仍然是一個(gè)凝聚的整體。更棒的是:當(dāng)我們?nèi)サ裟切┎槐匾脑睾?,?shù)據(jù)更為突出了,如下圖所示。

連續(xù)原則

連續(xù)原則與閉合原則類似:當(dāng)我們觀察物體時(shí),盡管沒有顯式的路徑,但我們的眼睛傾向 于尋找最平穩(wěn)的路徑并自然地創(chuàng)造出連續(xù)性。如下圖的示例,如果我將圖1的兩部分分開, 大多數(shù)人期望看到的是圖2的情況,而實(shí)際可能是圖3。

談到該原則的使用,我將豎直的 y 軸從下圖中移除。你仍然能看到條形圖是對齊的,因 為左側(cè)標(biāo)簽和右側(cè)數(shù)據(jù)間的空白一致(最平穩(wěn)的路徑)。與閉合原則的應(yīng)用一樣,去掉不必要的 元素會(huì)使數(shù)據(jù)更為突出。

連接原則

最后一個(gè)格式塔原則是連接原則。我們傾向于將物理連接的物體視作一個(gè)群體。連接屬性 通常比相似的顏色、大小和形狀有更強(qiáng)的關(guān)聯(lián)價(jià)值。在下圖中,你很可能將線條連接的形 狀(而非相似顏色、大小或形狀)視為一對,這就是連接原則在起作用。連接屬性通常沒有包 圍原則那么強(qiáng),但你可以通過線條的粗細(xì)和深淺來影響這種關(guān)系以達(dá)到理想的視覺層次。

我們經(jīng)常在折線圖中使用連接原則以幫助眼睛看到數(shù)據(jù)中的規(guī)則,如下圖所示。

通過這些簡介,可能你已經(jīng)了解到格式塔原則能夠幫助我們理解人們?nèi)绾斡^察,從而用于識別不必要的元素并減少視覺溝通的處理。進(jìn)而去避免雜亂,幫助受眾更容易更直觀的去了解藏在數(shù)據(jù)下面的我們想表達(dá)的東西。

未完待續(xù),且聽下回分解……

最后奉上,近幾年最中意的一張圖:

原文鏈接:https://www.phyet.com/data-visualization

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容