數(shù)據(jù)可視化 - 圖表

想通過(guò)這篇分享, 總結(jié)下用過(guò)的一些數(shù)據(jù)可視化方式, 主要是想分享下圖表的一些使用心得. 數(shù)據(jù)可視化其實(shí)是一門挺有深度的學(xué)問(wèn), 也看過(guò)一些書. 這里的內(nèi)容還是從基本的圖表解釋, 從簡(jiǎn)單開(kāi)始, ?how to see everything is very important for our BUSSINESS.

先介紹幾個(gè)基本視圖的使用及應(yīng)用場(chǎng)景, 部分信息和圖表參考于Data Visualization with JS

柱狀圖: ?二維數(shù)據(jù)集, 適用于只需要比較其中一維, 利用柱子的高度表現(xiàn)差異, 不過(guò)只適用于小規(guī)模的數(shù)據(jù)集. 通常X軸是時(shí)間軸, 如果X軸不是時(shí)間維, 建議用顏色區(qū)分柱子, 改變用戶對(duì)時(shí)間趨勢(shì)的關(guān)注.

折線圖:二維大數(shù)據(jù)集, 尤其是在表現(xiàn)和強(qiáng)調(diào)數(shù)據(jù)趨勢(shì)時(shí)適用, 可以讓用戶忽略單個(gè)的數(shù)據(jù)點(diǎn). 而且折線圖比較適合多個(gè)相關(guān)的二維數(shù)據(jù)的比較.

餅圖: ?通常用于二維, 適用于反映部分與整體的關(guān)系, 餅圖并不適合比較元素間的度量關(guān)系, 因?yàn)槿藢?duì)面積的感覺(jué)并不靈敏, 所以餅圖更適合表現(xiàn)部分與整體的占比情況,?

散點(diǎn)圖: ? 適用于三維數(shù)據(jù)集,但只比較其中兩維,可通過(guò)顏色區(qū)分第三維. 比如比較某個(gè)國(guó)家的醫(yī)療支出和預(yù)期壽命, 地區(qū)靠顏色區(qū)分, 只有后兩個(gè)維度需要比較

氣泡圖: ?三維或四維 ? 散點(diǎn)圖的變體,通過(guò)氣泡大小區(qū)分第三維,通過(guò)顏色或標(biāo)簽區(qū)分第四維. 因?yàn)橛脩魧?duì)面積大小敏感度低, 所以適用于不要求精確辨識(shí)第三維的場(chǎng)景. 其實(shí)我們可以注意到, 下面我做的這張圖表現(xiàn)的維度雖然也只是四維, 不過(guò)通過(guò)餅圖做到了對(duì)比各個(gè)地區(qū)業(yè)務(wù)分配比例的效果.

雷達(dá)圖:

? 四維以上, 并且每個(gè)維度可以度量并排序, 雷達(dá)圖對(duì)數(shù)據(jù)特征有幾個(gè)要求或者說(shuō)喜好: 1 數(shù)據(jù)點(diǎn)要少, 一般不超過(guò)六個(gè); 2 數(shù)據(jù)有多個(gè)維度, 一般四個(gè)以上, 可以通過(guò)顏色增加一個(gè)維度的信息, 但不參與分析. 3 維度可度量和排序.

上圖取自參考文檔截圖, 是熱火首發(fā)五人的技術(shù)指標(biāo)分析, 根據(jù)定義, 面積越大越重要, 所以James確實(shí)很重要:)


此外, 還有一些有意思的, 也比較有意義的展示方式, 也簡(jiǎn)單列舉幾個(gè):

漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范, 周期長(zhǎng), 環(huán)節(jié)多的流程分析, 通過(guò)漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較, 能夠直觀地發(fā)現(xiàn)和說(shuō)明問(wèn)題所在. 通常用來(lái)運(yùn)營(yíng)分析改進(jìn)產(chǎn)品設(shè)計(jì)流程, 分析商機(jī)轉(zhuǎn)化等.

(矩形) 樹(shù)圖:一種有效的實(shí)現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu), 適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集.

熱力圖:以特殊高亮的形式顯示訪客熱衷的頁(yè)面區(qū)域和訪客所在的地理區(qū)域的圖示,它基于GIS坐標(biāo),用于顯示對(duì)象的相對(duì)密度, 下圖是我們的呼叫熱力圖.

詞云:各種關(guān)鍵詞的集合,往往以字體的大小或顏色代表對(duì)應(yīng)詞的頻次. 是一種比較有意思的展現(xiàn)形式, 不過(guò)我覺(jué)得有意思的成分大于其實(shí)際意義. 有一定的視覺(jué)沖擊力, 做宣傳封面或者海報(bào)時(shí)見(jiàn)得比較多.?

推薦一個(gè)在線制作詞云, 很漂亮的工具,?https://wordart.com/create, 下圖是我用時(shí)間簡(jiǎn)史的內(nèi)容做的詞云, 還是很有感染力的

盒須圖:

也叫箱形圖, 盒式圖或者箱線圖. 主要用于對(duì)數(shù)據(jù)分布的顯示, 如下圖所示, 主要包含六個(gè)數(shù)據(jù)節(jié)點(diǎn), 將一組數(shù)據(jù)從大到小排列, 分別計(jì)算出他的上邊緣, 上四分位數(shù)Q3, 中位數(shù), 下四分位數(shù)Q1, 下邊緣, 還有一個(gè)異常值. 大家可以自己對(duì)應(yīng)下.

關(guān)系圖: 表現(xiàn)的是數(shù)據(jù)對(duì)象間的關(guān)系, 是聚類常用的一種方法, 建議了解下基于圖論的聚類算法, 了解下什么是DAG等等, 圖論也是一個(gè)特別有意思的所在.?圖論分裂聚類算法的主要思想是: 構(gòu)造一棵關(guān)于數(shù)據(jù)的最小生成樹(shù)(minimal spanning tree,簡(jiǎn)稱MST), 通過(guò)刪除最小生成樹(shù)的最長(zhǎng)邊來(lái)形成類.?

如下圖所示,?當(dāng)初為了基于關(guān)系對(duì)設(shè)備進(jìn)行聚類和分析, 還專門做了一個(gè)軟件包.

好了, 先簡(jiǎn)單羅列這么多, 希望多開(kāi)幾個(gè)頭, 以后有時(shí)間慢慢的展開(kāi)討論.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容