老規(guī)矩,講事情前鋪墊還是要有的,常見的可視化科普我們就不再提及了,換個角度談?wù)効梢暬瑢扅c沒看過的。
1. 什么是數(shù)據(jù)可視化?
數(shù)字是信息呈現(xiàn)的一種方式,而數(shù)據(jù)可視化是對數(shù)字的圖形表達(dá),常見有地圖、道路實況熱力圖、統(tǒng)計圖表等,實現(xiàn)更清晰、更高效的信息交互。
2. 為什么寫到數(shù)據(jù)可視化?
1> 相信你一定聽過這句話“干活抵不過會畫PPT!”,而數(shù)據(jù)可視化是PPT的重要組成部分,就從坊間一句玩笑話,也可窺見信息可視化的重要性;
2>?對于大部分技術(shù)類從業(yè)者,數(shù)據(jù)可視化是技能短板(但對數(shù)據(jù)專家而言是必備技能);
3> 就個人而言,隨著年歲漸長對數(shù)據(jù)可視化的理解逐漸深刻,所以補上這一課。
“他笑話他只會吹牛寫PPT,他笑話他只會干活不懂思考,然后他碼了代碼他畫了PPT。”

以一個筆者最近經(jīng)常遇到的問題來開始本篇吧>>>
請看題:如下圖所示,A1-A10代表小魏近1年的10項消費支出類目,百分比代表此項的支出占比,以快速找到支出最大的前兩項為目標(biāo),你會選擇哪種圖表來呈現(xiàn)數(shù)據(jù)?可以有表格、扇形圖、柱形圖、條形圖或其他圖表,以及為什么選擇這類圖表來展示?在無占比降序、圖表無數(shù)據(jù)標(biāo)簽的情況下又會如何選擇?(歡迎留言給出你的答案?。。。?/p>

筆者常常糾結(jié)于扇形圖與條形圖之間,不知選哪一個更好,主要糾結(jié)在兩方面:
1> 從個人喜好出發(fā),條形圖的類目文字、坐標(biāo)軸、數(shù)字標(biāo)簽展示更為清晰;
2> 數(shù)據(jù)需要呈現(xiàn)給讀者,在大部分讀者認(rèn)知中,扇形圖是占比類數(shù)據(jù)的第一圖表選擇。
柱形圖其實不大糾結(jié),因為如果分類多或分類的字符過長,會展示不清晰。
那么有沒有更為科學(xué)的方法來指導(dǎo)我們,什么樣的圖表是更好的圖表?

接下來圍繞3個主題展開:
1. 圖形感知實驗
2. 常用圖表類型
3. 可視化技巧
一、圖形感知實驗
1984年統(tǒng)計學(xué)家克利夫蘭與麥吉爾在《美國統(tǒng)計協(xié)會會刊》(JASS)發(fā)表一篇論文【圖形感知:圖形方法研究的理論、實驗和應(yīng)用】(Graphical Perception:Theory, Experimentation, and Application to the Development of Graphical Methods),著重研究關(guān)于可視化是否有方法可遵循,而不僅僅憑借直覺、經(jīng)驗,我們一起來看看他們是如何進(jìn)行實驗的>>>
1. 確定圖形感知的判斷標(biāo)準(zhǔn):以定量信息的判斷準(zhǔn)確性為指標(biāo),并非追求數(shù)字的精確,而是追求更精準(zhǔn)的判斷。
2. 對下圖中所示圖表,僅根據(jù)視覺作出判斷:
實驗1: Type1-Type5圖中,帶有標(biāo)記點的數(shù)據(jù),哪個更大?較大的是較小的幾倍?
實驗2:扇形圖與條形圖中,哪一個分組最大?最大的是其他較小分組的幾倍?

3. 實驗1有55位測試者參與,實驗2有54位測試者參與,在測試時各個圖表的數(shù)值隨機生成(上圖為示例)。
分類柱形圖具有相同水平坐標(biāo)可以作為對位置的判斷,堆積柱形圖作為對長度的判斷,扇形圖作為對角度的判斷。
4. 對比實驗結(jié)果:
1> 測試者的判斷結(jié)果與實際結(jié)果之間的誤差值,及誤差區(qū)間;
2> 對比不同圖表出現(xiàn)較大判斷誤差的概率值。

結(jié)論:基于位置的判斷要比基于長度的判斷更準(zhǔn)確,基于位置的判斷比角度判斷更準(zhǔn)確。
也就回答了開篇的問題:扇形圖與條形圖你選誰?我選條形圖。
不得驚艷于學(xué)者們的研究能力,知其然且知其所以然才能靈活運用,這里只是取了論文的一小部分來說明,如果需要論文原稿,可以在公眾號私信獲取。
二、常用圖表類型
市場上有非常多可視化的專業(yè)工具,不同工具的可視化能力不同,從普適性角度出發(fā)(免費),以Excel、PPT的基礎(chǔ)圖表來說明。

根據(jù)你想表達(dá)什么樣的數(shù)據(jù)信息,將圖表分為六大類:
1. 類別比較,如:不同月份的銷售額、不同銷售渠道的銷售額;
2. 變化趨勢,如:近1年的銷售額趨勢、近3年上海的氣溫變化;
3. 整體局部,如:某商品的銷售額占比、某企業(yè)的市場占有量;
4. 熱力分布,如:網(wǎng)頁瀏覽的熱力圖、商城的訪問熱力圖,通過Excel自帶的條件格式-色階即可實現(xiàn);
5. 數(shù)據(jù)關(guān)系,如:商品數(shù)與消費人數(shù)的關(guān)系、價格與銷量的關(guān)系;
6. 數(shù)據(jù)分布,如:客單價的分布、視頻觀看時長的分布,在計算好分位點數(shù)值后,可以用股價圖實現(xiàn)。

上圖中僅給出了基礎(chǔ)圖表,主要用于說明數(shù)據(jù)信息的類型;對于新型以及復(fù)雜度較高的圖表,可以通過基礎(chǔ)圖表的組合變化實現(xiàn),如:漏斗圖,可以通過對條形圖透明度設(shè)置實現(xiàn)。

三、可視化技巧
由于個人水平有限,僅分享1個技巧吧(跟設(shè)計師們學(xué)的)。

做PPT、畫圖表的時候經(jīng)常會遇到配色問題,怎么調(diào)整都顯得很突兀,或許色輪可以幫你解決一部分問題。
啥是色輪?即成像三原色相互交替構(gòu)成一個顏色盤。
可以用這三種搭配來調(diào)色:
1> 相近色,即同色漸變色;
2> 相對色,一條直徑連接的兩個對立顏色,用于突出內(nèi)容;
3> 相鄰色,選擇臨近的幾個顏色,為同一個色調(diào),如冷色調(diào)、暖色調(diào)。

本篇就分享到這里啦,歡迎點贊、分享、關(guān)注,也可以催稿哦~