使用tableau進行數(shù)據(jù)可視化分析

作者:hooly

微信公眾號:一口袋星光

在介紹tableau之前,我們先看一個示例:

從網(wǎng)上download一份2016年全年北京市空氣質(zhì)量的數(shù)據(jù),做了一個可視化的圖表,看圖:

圖片來自hooly‘mac

通過上圖我們可以清晰的看到2016年全年北京市的空氣質(zhì)量情況,細致觀察后我們發(fā)現(xiàn),2016年12月差不多有半個月的時間里北京市處于重度以及嚴重污染的狀況。(ノへ ̄、)捂臉

圖片來自hooly'mac

以上就是使用tableau花費不到5分鐘完成的一份可視化的數(shù)據(jù)圖表。如果你已經(jīng)對tableau產(chǎn)生了興趣,那么我們就來具體聊一下吧~

what is tableau?

Tableau Software幫助人們查看并理解數(shù)據(jù)。幫助你快速分析、可視化并分享信息。

why tableau?

當(dāng)今社會,商戶智能(Business Intelligence,BI)被廣泛應(yīng)用各個行業(yè),并在輔助商業(yè)決策方面發(fā)揮了重大的作用。但是傳統(tǒng)的BI架構(gòu)在處理企業(yè)數(shù)據(jù)時候有很多的弊端:

開發(fā)難度高,上線周期長

架構(gòu)笨重,無法靈活響應(yīng)

運維成本高

而tableau是一款定位數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)的商務(wù)智能展現(xiàn)工具,具有以下核心優(yōu)勢:

數(shù)據(jù)獲取極速高效

用戶體驗良好且易用的表現(xiàn)形式

易學(xué),不需要技術(shù)背景和復(fù)雜的統(tǒng)計知識

操作十分簡單

what can tableau do ?

我們繼續(xù)來看幾組很cool的可視化數(shù)據(jù)圖表,來深入了解下tableau能為我們展現(xiàn)什么

NO1.第 113 屆美國國會投票記錄-每個Question下投票記錄數(shù)

數(shù)據(jù)下載地址:https://public.tableau.com/zh-cn/s/resources

圖片來自hooly‘mac

當(dāng)然,你也可以使用餅狀圖來表示:


圖片來自hooly‘mac

NO2.1910年美國各個州出生嬰兒數(shù)

數(shù)據(jù)下載地址:https://public.tableau.com/zh-cn/s/resources

圖片來自hooly‘mac

上圖的原數(shù)據(jù)我們可以看一下,數(shù)據(jù)字段:美國州名、嬰兒性別、出生年月、數(shù)目

圖片來自hooly‘mac

值得一提的是tableau可以自動識別某一些地理位置的編號,以及日期類型的格式:d=====( ̄▽ ̄*)b厲害

圖片來自hooly‘mac

1910年~2012年各個州出生的男女嬰兒數(shù)目:在每個州出生的所有嬰兒里面,我們用顏色標識了男女性別的嬰兒。

圖片來自hooly‘mac

接下來,1910年~2012年美國全國男女嬰兒出生數(shù)目情況:

圖片來自hooly‘mac

由上圖我們看出,從1920年開始,女性嬰兒的數(shù)目開始和男性嬰兒數(shù)目拉開差距,且到1970年左右,差距越來越大。(484可以說美國人真的好重男輕女~(ノへ ̄、)捂臉)

其實tableau可以做的圖標形式還有很多很多,以上我簡單的列舉了幾種比較常用的。后面我們說下tableau實踐部分:

tableau界面介紹:

圖片來自hooy'mac

數(shù)據(jù)窗口:展示當(dāng)前使用的數(shù)據(jù)源,以及數(shù)據(jù)源包含的所有數(shù)據(jù)字段。在這里我們看到所有數(shù)據(jù)字段被分為兩類:維度和度量(敲黑板)。

維度和度量是tableau使用過程中最重要的兩個概念。

度量:往往是一個數(shù)值字段,將其拖放到功能區(qū)時,tableau默認會進行聚合運算,同時,試圖去會戰(zhàn)勝相應(yīng)的軸;

維度往往是一些分類、時間方面的定性字段,將其拖放到功能區(qū)時,tableau不會對其進行字段,而是對視圖區(qū)進行分區(qū),維度的內(nèi)容顯示為歌曲的標題。

離散和聯(lián)連續(xù):

離散和連續(xù)是另一種數(shù)據(jù)角色分類,在tableau中,藍色是離散字段,綠色是連續(xù)字段,離散字段在行列功能區(qū)總是在視圖中顯示為標題,而連續(xù)字段則在試圖中顯示為軸:

連續(xù):

連續(xù)圖片來自hooly'mac

離散:

圖片來自hooly'mac

寫到這里,我們來回到文章的最初,講一下北京市空氣質(zhì)量情況的可視化圖表是如何完成的。

tableau示例詳解:

先看一下原始數(shù)據(jù):

圖片來自hooly'mac

step1:導(dǎo)入數(shù)據(jù):

導(dǎo)入數(shù)據(jù)圖片來自hooly’mac

step2:分析下我們想要的最終效果,我們需要在維度上按照季度和月份、以及天分類,而度量則是我們最終需要看的數(shù)據(jù):空氣質(zhì)量也就是AQI指數(shù)。

圖片來自hooly'mac

step3:于是我們做如下操作:

講日期拖到列標簽、行標簽(拖兩次),將日期單位分別置為:日、季度、月,然后選擇智能顯示中的第二個圖表類型

圖片來自hooly'mac

step4:發(fā)現(xiàn)和我們最終想要的還有一些差距。我們希望使用顏色來表示不同的污染程度,將AQI指數(shù)拖動到顏色上。同時我們不希望AQI對放塊兒的大小起作用,于是我們把形狀上的AQI指數(shù)去掉

圖片來自hooly;mac

step5:同時我們不希望AQI對放塊兒的大小起作用,于是我們把形狀上的AQI指數(shù)去掉:

圖片來自hooly'mac

step6:這時候我們需要改變方塊兒的顏色:

這里根據(jù)我們隊污染程度區(qū)間的定義:0~50:優(yōu);50~100:良;100~150:輕度污染;.....等

我們需要對AQI空氣指數(shù)進行分組:

圖片來自hooly'mac

step7:分組完成

圖片來自hooly'mac

step8:我們把AQI在顏色上的標記去掉,把剛剛的AQI分組拖到顏色標記上:

圖片來自hooly'mac

step9:oh,好像差不多了,只是顏色還有點詭異,沒關(guān)系,我們改一下顏色:

圖片來自hooly'mac
圖片來自hooly'mac

step10:我們給每個組分配上不同的顏色,使其更好區(qū)分污染程度。然后點擊工作表-復(fù)制-圖像:

圖片來自hooly'mac

啊哈,完成!

圖片來自hooly'mac

如果您對tableau感興趣,還可以看我另外文章:

tableau實戰(zhàn)基礎(chǔ)功能

利用tabeau制作交互式圖表

作者:hooly

微信公眾號:一口袋星光

我會在微信公號上持續(xù)更新我的文章,你來討論我很歡迎。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容