對可視化的使用認(rèn)知或許來源于下面這張圖。雖然結(jié)構(gòu)清晰,但它只針對Excel圖表,不夠豐富,本文會結(jié)合數(shù)據(jù)分析師的使用場景展示更多的可視化案例,用對圖勝于用絢麗的圖表。(圖表均來自網(wǎng)絡(luò))
豐富的圖表可以通過位置、長度、角度、方向、形狀、面積、體積、飽和度、色調(diào)來產(chǎn)生視覺暗示,達(dá)到聚焦用戶視線,表達(dá)圖表所表達(dá)含義。

Ⅰ、常用三大圖:柱(條)、線、餅(環(huán))
柱狀圖:柱形圖是分析師最常用到的圖表之一,常用于多個維度的比較和變化。文本維度/時間維度通常作為X軸。數(shù)值型維度作為Y軸。柱形圖至少需要一個數(shù)值型維度。柱形圖的對比分析,通過顏色區(qū)分類別。當(dāng)需要對比的維度過多,柱形圖是力不從心的。
基礎(chǔ)柱狀圖:每個組數(shù)據(jù)建議只展示1~3列數(shù)據(jù),太多會導(dǎo)致對比困難,圖形煩亂;表現(xiàn)每條數(shù)據(jù)具體值,容易比較大小

條形圖:容易比較大小,更關(guān)注組內(nèi)比較

含正負(fù)值的條形圖:顯示兩個項目之間有沒有相關(guān)關(guān)系

堆積條形圖(堆積柱狀圖):比較組內(nèi)占比情況,同時可以比較各組每部分及整體大小

瀑布圖:各成分分布構(gòu)成情況

折線圖:折線圖是觀察數(shù)據(jù)的趨勢,它和時間是好基友,當(dāng)我們想要了解某一維度在時間上的規(guī)律或者趨勢時,就用折線圖吧。
基礎(chǔ)折線圖:每組數(shù)據(jù)建議最多不超過5個點;數(shù)據(jù)常表現(xiàn)趨勢,波動

餅圖(環(huán)圖):餅圖是有缺陷的,它擅長表達(dá)某一占比較大的類別。但是不擅長對比。30%和35%在餅圖上憑肉眼是難以分辨出區(qū)別的。當(dāng)類別過多,也不適宜在餅圖上表達(dá)。
餅圖:可展示多組數(shù)據(jù);表現(xiàn)各組數(shù)據(jù)占總比情況。

雙餅圖:展示各組內(nèi)分布情況

Ⅱ、面積圖、散點圖(氣泡圖)、雷達(dá)圖
面積圖
面積圖:通過面積展示數(shù)據(jù)值大小,形象直觀

散點圖:散點圖在報表中不常用到,但是在數(shù)據(jù)分析中可以算出鏡率最高的。散點圖通過坐標(biāo)軸,表示兩個變量之間的關(guān)系。繪制它依賴大量數(shù)據(jù)點的分布。直觀,尤其是大數(shù)據(jù)量,散點圖會有更精準(zhǔn)的結(jié)果。比如統(tǒng)計中的回歸分析,比如數(shù)據(jù)挖掘中的聚類。
散點圖:優(yōu)勢是揭示數(shù)據(jù)間的關(guān)系,發(fā)覺變量與變量之間的關(guān)聯(lián)。

氣泡圖:在散點圖的基礎(chǔ)上加上面積標(biāo)示大小,富裕散點圖比較大小的功能;氣泡圖經(jīng)常需要輔助線來獲得圖形結(jié)論

雷達(dá)圖:可能男同胞們在游戲中看到它比較多。它在商務(wù)、財務(wù)領(lǐng)域應(yīng)用較大,適合用在固定的框架內(nèi)表達(dá)某種已知的結(jié)果。常見于經(jīng)營狀況,財務(wù)健康程度。
雷達(dá)圖:用來展示某一類型事物在幾個屬性的優(yōu)良情況,或該類事物互相對比

Ⅲ、地理圖、熱力圖、矩形樹圖
地理圖:一切和空間屬性有關(guān)的分析都可以用到地理圖。比如各地區(qū)銷量,或者某商業(yè)區(qū)域店鋪密集度等。
地理圖:地理圖的繪制離不開地圖數(shù)據(jù),POI是很重要的要素。POI是“Point of Information”的縮寫,可以翻譯成信息點,每個POI包含四方面信息,名稱、類別、經(jīng)度緯度、附近的酒店飯店商鋪等信息。借助POI,才能按地理維度展現(xiàn)數(shù)據(jù)。

熱力圖:互聯(lián)網(wǎng)產(chǎn)品中,熱力圖可以用于網(wǎng)站/APP的用戶行為分析,將瀏覽、點擊、訪問頁面的操作以高亮的可視化形式表現(xiàn)。
熱力圖:需要數(shù)據(jù)量較大,常出現(xiàn)在BI系統(tǒng),很少通過數(shù)據(jù)分析師制作

矩形樹圖:柱形圖不適合表達(dá)過多類目(比如上百)的數(shù)據(jù),矩形樹圖的出現(xiàn),直觀地以面積表示數(shù)值,以顏色表示類目。
矩形樹圖:還可以在每個小面積增加數(shù)據(jù)點,來代表峰值,最大值。電子商務(wù)、產(chǎn)品銷售等涉及大量品類的分析,都可以用到矩形樹圖

Ⅴ、?;鶊D、漏斗圖、箱線圖
?;鶊D:表示信息的變化和流動狀態(tài)
?;鶊D:數(shù)據(jù)分析師經(jīng)常接觸到桑基圖,只是不知道它的正式名字,它就是Google網(wǎng)站分析中的用戶行為和流量分析。用戶從哪里來,去了哪個頁面,在哪個頁面離開,最后停留在哪個頁面,比例分析等

漏斗圖:轉(zhuǎn)化率可視化,它適用在固定流程的轉(zhuǎn)化分析,你也可以認(rèn)為它是桑基圖的簡化版
漏斗圖:轉(zhuǎn)化率也可以用幾組數(shù)字表示,不一定做成漏斗圖,當(dāng)然,為了顯得自己更專業(yè)

箱線圖:準(zhǔn)確地反映數(shù)據(jù)維度的離散(最大數(shù)、最小數(shù)、中位數(shù)、四分?jǐn)?shù))情況。凡是離散的數(shù)據(jù)都適用箱線圖。
箱線圖:線的上下兩端表示某組數(shù)據(jù)的最大值和最小值。箱的上下兩端表示這組數(shù)據(jù)中排在前25%位置和75%位置的數(shù)值。箱中間的橫線表示中位數(shù)。假如你是一位互聯(lián)網(wǎng)電商分析師,你想知道某商品每天的賣出情況:該商品被用戶最多購買了幾個,大部分用戶購買了幾個,用戶最少購買了幾個。箱線圖就能很清晰的表示出上面的幾個指標(biāo)以及變化

Ⅵ、其他圖形
詞云
用來展示高頻出現(xiàn)的詞,搜索詞等
關(guān)系圖
展現(xiàn)事物相關(guān)性和關(guān)聯(lián)性的圖表,比如社交關(guān)系鏈、品牌傳播、或者某種信息的流動
堆積玫瑰圖
優(yōu)點:可在一個圖表中集中反映多個維度方面的百分比構(gòu)成數(shù)據(jù),幅面小,信息量大,形式新穎,吸引注意力,夠高級,夠給力:)
缺點:非常見圖表形式,多數(shù)人不易看懂。圖形存在誤導(dǎo)因素,同樣的半徑長度,越往外面積越大,但實際是以長度代表數(shù)值。
適用場合:適合書面研讀,不太適合PPT講解。適合商業(yè)雜志、財經(jīng)報刊等媒體做信息圖表用途,傳統(tǒng)工作場合需慎用,可能會給人用力過猛、炫技、夸張的感覺。
混合圖
常見混合圖為線柱混合圖