數(shù)據(jù)可視化——Tableau數(shù)據(jù)連接

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 作者丨王炸

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 來(lái)源丨醫(yī)數(shù)思維云課堂(ID:Datamedi)? ?

這一期,小編向大家介紹Tableau?數(shù)據(jù)連接,主要介紹Tableau 與各種數(shù)據(jù)源連接的基礎(chǔ)知識(shí),比如與文本文件、Excel、Access 文件、SQL Server、ODBC 數(shù)據(jù)源以及剪貼板的連接。討論怎樣使用篩選來(lái)減少可分析的數(shù)據(jù),以及怎樣合并兩種不同的數(shù)據(jù)源。

01?數(shù)據(jù)源

可來(lái)自本地的Excel、Access、文本文檔等,或者鏈接到外邊的數(shù)據(jù)庫(kù),兼容性超強(qiáng)。不列舉了,看圖:

數(shù)據(jù)源有了,開(kāi)始導(dǎo)入吧!等等,需要注意的是,導(dǎo)入你的數(shù)據(jù)源之前最好做個(gè)清理,因?yàn)門(mén)ableau主打的不是數(shù)據(jù)清理而是成像啊~當(dāng)然它內(nèi)部也能對(duì)數(shù)據(jù)做一些簡(jiǎn)單刪選、計(jì)算,但沒(méi)有如Excel之類(lèi)處理起來(lái)那么順手。

所以最好導(dǎo)入的數(shù)據(jù)源是清理過(guò)的,比如首行已經(jīng)是字段名,地理信息補(bǔ)全,日期字段已經(jīng)轉(zhuǎn)換成日期格式。

02??理解維度和度量

Tableau 把數(shù)據(jù)劃分成兩種主要的類(lèi)型:維度和度量。

維度通常是指那些不可被聚合的字段;度量,是可以被測(cè)量和聚合或者用于數(shù)學(xué)運(yùn)算的字段。維度通常作為行列的字頭;度量通常是指繪制或者給標(biāo)記的大小賦值。

03?應(yīng)用篩選器

數(shù)據(jù)分析過(guò)程,如果需要減少可供分析的數(shù)據(jù)或者在某個(gè)特定的字段值下過(guò)濾數(shù)據(jù),應(yīng)用篩選器是一個(gè)非常不錯(cuò)的方法。

篩選是一個(gè)較好處理工作表中數(shù)據(jù)的方式。根據(jù)字段數(shù)據(jù)類(lèi)型,不同的篩選器類(lèi)型可以應(yīng)用到一個(gè)字段上。這些篩選器可以是用數(shù)字條件來(lái)限制數(shù)字字段或者用文本模式來(lái)限制字符串字段。

04?合并不同數(shù)據(jù)源

數(shù)據(jù)有時(shí)以不同格式或者不同文件存儲(chǔ)。在關(guān)系數(shù)據(jù)庫(kù)中,如果兩個(gè)不同的表有相同的字段,我們可以用這個(gè)字段將這兩個(gè)表合并在一起,并且通過(guò)一個(gè)查詢中把數(shù)據(jù)提取出來(lái)。Tableau支持單一數(shù)據(jù)源連接的合并;然而為了合并多種數(shù)據(jù)源連接,Tableau使用數(shù)據(jù)混合。

在同一個(gè)的工作表中,Tableau通過(guò)數(shù)據(jù)源的共有字段來(lái)創(chuàng)建關(guān)聯(lián),并運(yùn)用關(guān)聯(lián)來(lái)合并兩個(gè)或兩個(gè)以上的不同數(shù)據(jù)源??梢栽陉P(guān)聯(lián)中指定數(shù)據(jù)源中的共有字段,從而自定義混同操作。同時(shí),這種混配不同于兩個(gè)表的連接。因?yàn)楫?dāng)我們連接兩個(gè)表時(shí),我們創(chuàng)建的是行連接,并可以再這兩個(gè)表中添加字段。

然而,在混配里,我們僅僅在單個(gè)可視化圖形中顯示不同數(shù)據(jù)源中的不同字段。


數(shù)據(jù)集的理想呈現(xiàn)方式:

每列是一個(gè)變量,在Tableau中稱為字段,第一行包含列標(biāo)題,其中每行包含數(shù)據(jù)的值。在連接到Tableau中可以檢查列標(biāo)題,從而確認(rèn)文件格式是否正確。


切換到工作表時(shí),可以在左側(cè)窗格看到這些字段。

這種數(shù)據(jù)集很常見(jiàn),但也有可能遇到略有不同的數(shù)據(jù)集。

實(shí)際表可能不在電子表格的左上角,而是在頁(yè)面的其他位置。表格中有更多行或者列,其中可能有標(biāo)題、說(shuō)明或注腳。國(guó)際組織或政府機(jī)構(gòu)發(fā)布的表中尤為常見(jiàn),因?yàn)楸砀裨O(shè)計(jì)的初衷就是供人使用而不是供軟件使用。

在Tableau中打開(kāi)這個(gè)表,就可以發(fā)現(xiàn)這個(gè)表格沒(méi)有列標(biāo)題。此時(shí),打開(kāi)數(shù)據(jù)解釋器,就可刪除不屬于表格的標(biāo)題、說(shuō)明、腳注。一個(gè)表中包含多個(gè)表時(shí)這種情況同樣適用。

Tableau數(shù)據(jù)鏈接到這里就完成了,希望對(duì)大家能有所幫助,下一期我們共同學(xué)習(xí)Tableau初級(jí)圖形繪制,期待你與我共同進(jìn)步?。?!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容