作者:hooly
微信公眾號:一口袋星光
在介紹tableau之前,我們先看一個示例:
從網(wǎng)上download一份2016年全年北京市空氣質(zhì)量的數(shù)據(jù),做了一個可視化的圖表,看圖:

通過上圖我們可以清晰的看到2016年全年北京市的空氣質(zhì)量情況,細致觀察后我們發(fā)現(xiàn),2016年12月差不多有半個月的時間里北京市處于重度以及嚴重污染的狀況。(ノへ ̄、)捂臉
圖片來自hooly'mac
以上就是使用tableau花費不到5分鐘完成的一份可視化的數(shù)據(jù)圖表。如果你已經(jīng)對tableau產(chǎn)生了興趣,那么我們就來具體聊一下吧~
what is tableau?
Tableau Software幫助人們查看并理解數(shù)據(jù)。幫助你快速分析、可視化并分享信息。
why tableau?
當(dāng)今社會,商戶智能(Business Intelligence,BI)被廣泛應(yīng)用各個行業(yè),并在輔助商業(yè)決策方面發(fā)揮了重大的作用。但是傳統(tǒng)的BI架構(gòu)在處理企業(yè)數(shù)據(jù)時候有很多的弊端:
開發(fā)難度高,上線周期長
架構(gòu)笨重,無法靈活響應(yīng)
運維成本高
而tableau是一款定位數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)的商務(wù)智能展現(xiàn)工具,具有以下核心優(yōu)勢:
數(shù)據(jù)獲取極速高效
用戶體驗良好且易用的表現(xiàn)形式
易學(xué),不需要技術(shù)背景和復(fù)雜的統(tǒng)計知識
操作十分簡單
what can tableau do ?
我們繼續(xù)來看幾組很cool的可視化數(shù)據(jù)圖表,來深入了解下tableau能為我們展現(xiàn)什么
NO1.第 113 屆美國國會投票記錄-每個Question下投票記錄數(shù)
數(shù)據(jù)下載地址:https://public.tableau.com/zh-cn/s/resources

當(dāng)然,你也可以使用餅狀圖來表示:

NO2.1910年美國各個州出生嬰兒數(shù)
數(shù)據(jù)下載地址:https://public.tableau.com/zh-cn/s/resources

上圖的原數(shù)據(jù)我們可以看一下,數(shù)據(jù)字段:美國州名、嬰兒性別、出生年月、數(shù)目

值得一提的是tableau可以自動識別某一些地理位置的編號,以及日期類型的格式:d=====( ̄▽ ̄*)b厲害

1910年~2012年各個州出生的男女嬰兒數(shù)目:在每個州出生的所有嬰兒里面,我們用顏色標識了男女性別的嬰兒。

接下來,1910年~2012年美國全國男女嬰兒出生數(shù)目情況:

由上圖我們看出,從1920年開始,女性嬰兒的數(shù)目開始和男性嬰兒數(shù)目拉開差距,且到1970年左右,差距越來越大。(484可以說美國人真的好重男輕女~(ノへ ̄、)捂臉)
其實tableau可以做的圖標形式還有很多很多,以上我簡單的列舉了幾種比較常用的。后面我們說下tableau實踐部分:
tableau界面介紹:

數(shù)據(jù)窗口:展示當(dāng)前使用的數(shù)據(jù)源,以及數(shù)據(jù)源包含的所有數(shù)據(jù)字段。在這里我們看到所有數(shù)據(jù)字段被分為兩類:維度和度量(敲黑板)。
維度和度量是tableau使用過程中最重要的兩個概念。
度量:往往是一個數(shù)值字段,將其拖放到功能區(qū)時,tableau默認會進行聚合運算,同時,試圖去會戰(zhàn)勝相應(yīng)的軸;
維度往往是一些分類、時間方面的定性字段,將其拖放到功能區(qū)時,tableau不會對其進行字段,而是對視圖區(qū)進行分區(qū),維度的內(nèi)容顯示為歌曲的標題。
離散和聯(lián)連續(xù):
離散和連續(xù)是另一種數(shù)據(jù)角色分類,在tableau中,藍色是離散字段,綠色是連續(xù)字段,離散字段在行列功能區(qū)總是在視圖中顯示為標題,而連續(xù)字段則在試圖中顯示為軸:
連續(xù):

離散:

寫到這里,我們來回到文章的最初,講一下北京市空氣質(zhì)量情況的可視化圖表是如何完成的。
tableau示例詳解:
先看一下原始數(shù)據(jù):

step1:導(dǎo)入數(shù)據(jù):

step2:分析下我們想要的最終效果,我們需要在維度上按照季度和月份、以及天分類,而度量則是我們最終需要看的數(shù)據(jù):空氣質(zhì)量也就是AQI指數(shù)。

step3:于是我們做如下操作:
講日期拖到列標簽、行標簽(拖兩次),將日期單位分別置為:日、季度、月,然后選擇智能顯示中的第二個圖表類型

step4:發(fā)現(xiàn)和我們最終想要的還有一些差距。我們希望使用顏色來表示不同的污染程度,將AQI指數(shù)拖動到顏色上。同時我們不希望AQI對放塊兒的大小起作用,于是我們把形狀上的AQI指數(shù)去掉

step5:同時我們不希望AQI對放塊兒的大小起作用,于是我們把形狀上的AQI指數(shù)去掉:

step6:這時候我們需要改變方塊兒的顏色:
這里根據(jù)我們隊污染程度區(qū)間的定義:0~50:優(yōu);50~100:良;100~150:輕度污染;.....等
我們需要對AQI空氣指數(shù)進行分組:

step7:分組完成

step8:我們把AQI在顏色上的標記去掉,把剛剛的AQI分組拖到顏色標記上:

step9:oh,好像差不多了,只是顏色還有點詭異,沒關(guān)系,我們改一下顏色:


step10:我們給每個組分配上不同的顏色,使其更好區(qū)分污染程度。然后點擊工作表-復(fù)制-圖像:

啊哈,完成!

如果您對tableau感興趣,還可以看我另外文章:
作者:hooly
微信公眾號:一口袋星光
我會在微信公號上持續(xù)更新我的文章,你來討論我很歡迎。