最近在系統(tǒng)學(xué)習(xí)Tableau,B站上也搜了一些視頻教程,無論是官方還是非官方,大多都是一上來做什么什么圖表,看著酷炫的可視化,總是有一些基本概念縈繞著不解。但似乎沒有太多人重視這些基本概念,著實讓我驚訝!就像看Tufte的定量數(shù)據(jù)的可視化,完全跟軟件操作沒關(guān)系,但如果你懂了他在講圖表可視化的基本邏輯,軟件工具就都只是將這些概念和原理可操作化,那樣你應(yīng)該會理解更深。但愿吧,在這個浮躁、太看重眼前利益的世界里,慶幸也還有你做個讀者,看我寫的這些文字。

Tableau
在Tableau的英文Elearning教程里,在初級課程前,是還有一門基礎(chǔ)課的,中文界面里只有初、中和高三個基本課程。正是這個我本來也要忽略的小白課程中談到了這3組概念。
- Dimensions與Measures數(shù)據(jù)分類:維度數(shù)據(jù)通常對應(yīng)類別數(shù)據(jù),與命名或名稱量表對應(yīng),是定性類數(shù)據(jù),通常描述類別,告訴你what, who, when等信息;而順序、等比和等距量表對應(yīng)的數(shù)字,通常會被Tableau讀取為測量數(shù)據(jù),是定量數(shù)據(jù)。維度通常是測量數(shù)據(jù)的觀察視角,可視化中視覺編碼通常對應(yīng)的便是維度(測量也可進(jìn)行視覺編碼,如顏色,但與維度在tableau中呈現(xiàn)方式有差異,表現(xiàn)為漸變)
- Granularity與Aggregation:數(shù)據(jù)粒度即數(shù)據(jù)的詳細(xì)程度,對于Tableau視圖中可視化的測量值,通常都以某種聚合方式展示,如默認(rèn)的SUM。這樣你其實是在俯視視角看數(shù)據(jù),看不到細(xì)節(jié),此時你可以慢慢加入維度作為編碼,從而降低觀察角度,看到維度代表的這一層數(shù)據(jù)細(xì)節(jié)。當(dāng)然如果你放進(jìn)的是代表每個值的個體維度,你就看到了數(shù)據(jù)最底層。
- Discrete與Continuous:離散型、連續(xù)型數(shù)據(jù)與維度和測量并不完全對等,在維度值中也可以有連續(xù)值,如時間;測量值也不完全是連續(xù)的,如時間。Tableau中通常把離散值對應(yīng)分類標(biāo)簽,總之是類別,無論坐標(biāo)軸還是不同顏色、大小等視覺編碼都是如此,對應(yīng)視圖區(qū)域的藍(lán)色膠囊;而連續(xù)值對應(yīng)坐標(biāo)軸,或篩選、編碼呈現(xiàn)方式中的連續(xù)區(qū)間,視圖區(qū)域顯示為綠色膠囊。