Tableau入門學(xué)習(xí)(一)

近些年來數(shù)據(jù)變得越來越重要了,其實這句話是有點問題的,數(shù)據(jù)一直都重要,只是由于以前的設(shè)備較少,因此采集到的數(shù)據(jù)也比較少,加之?dāng)?shù)據(jù)傳播也不方便,所以數(shù)據(jù)量很少,很多問題也沒能比較明顯的反映出來。

現(xiàn)在不一樣了,我們面對的是海量的數(shù)據(jù),量變帶來質(zhì)變,很多問題可以通過數(shù)據(jù)關(guān)聯(lián)分析找出來。當(dāng)然光有數(shù)據(jù)也是不夠的,如何有效的組織并呈現(xiàn)出來是直觀重要的一環(huán),因此就有了數(shù)據(jù)可視化,可以說它決定了我們能挖掘的數(shù)據(jù)價值的多少。

Tableau算是數(shù)據(jù)可視化比較容易入門的軟件。只需簡單的拖拽,就可以將各中類型的數(shù)據(jù)以多種圖表形式反映出來,然后將其嵌入到文檔或者網(wǎng)頁中,即便不是專門從事數(shù)據(jù)可視化方面的工作,也有必要學(xué)習(xí),可以通過tableau將數(shù)據(jù)組織好以后放到word或者ppt中。關(guān)鍵是tableau文件做好以后,可以用來處理同樣類型和結(jié)構(gòu)的數(shù)據(jù),很多人在工作中會碰到數(shù)據(jù)定期更新的表格或其他數(shù)據(jù)源,比如說一季度的銷售數(shù)據(jù),tableau文件做好以后,后續(xù)只要導(dǎo)入相同結(jié)構(gòu)和類型的二季度的數(shù)據(jù),生成的表格和圖形就會自動更新,不需要重復(fù)操作,節(jié)省很多工作量。

總之,tableau會讓你的數(shù)據(jù)分析變得越來越簡便,讓你把經(jīng)理集中在數(shù)據(jù)分析上而不是工具使用上,熟練使用以后,還可以通過它看到原來沒有注意到的數(shù)據(jù)本質(zhì)。


好了,那接下來我們就開始tableau的學(xué)習(xí)。

首先,打開數(shù)據(jù)源。我們選擇軟件自帶的“sample-Superstore”數(shù)據(jù)源,這樣大家都可以邊看邊練,實踐出真知嘛。雙擊“sample-Superstore”標(biāo)簽。

打開數(shù)據(jù)源以后,我們點擊左下角的“數(shù)據(jù)源”標(biāo)簽,先來看一下數(shù)據(jù)源的結(jié)構(gòu)。

其中標(biāo)注了數(shù)字“1”的是我們目前正在使用的連接。你可以點擊“添加”按鈕,將多個數(shù)據(jù)源放入到同一個tableau文件,也可以對相應(yīng)的數(shù)據(jù)源進行“編輯”、“重命名”和“移除”。標(biāo)注了數(shù)字“2”的地方是我們對數(shù)據(jù)源的使用方式:“實時數(shù)據(jù)”是保持對數(shù)據(jù)源的連接,后續(xù)數(shù)據(jù)源的更新會反映在tableau的圖表中。“數(shù)據(jù)提取”等同于數(shù)據(jù)導(dǎo)入,導(dǎo)入完成之后,tableau文件就和數(shù)據(jù)源沒有關(guān)系了。

在圖中,我們看到"sample-superstore"有3張表,目前只加入了“order”數(shù)據(jù)表,我們也可以將其他數(shù)據(jù)表加入。下面我們就來了解一下數(shù)據(jù)表的聯(lián)結(jié)方式,主要的聯(lián)結(jié)方式有以下幾種:

1. 內(nèi)部連接

內(nèi)部連接返回包括左表中的所有記錄和右表中聯(lián)結(jié)字段相等的記錄。使用內(nèi)聯(lián)接來合并表時,生成的表將包含與兩個表均匹配的值。

2. 左側(cè)連接

使用左聯(lián)接來合并表時,生成的表將包含左側(cè)表中的所有值以及右側(cè)表中的對應(yīng)匹配項。

當(dāng)左側(cè)表中的值在右側(cè)表中沒有對應(yīng)匹配項時,tableau將以 null 值填充。

3. 右側(cè)連接

使用右聯(lián)接來合并表時,生成的表將包含右側(cè)表中的所有值以及左側(cè)表中的對應(yīng)匹配項。

當(dāng)右側(cè)表中的值在左側(cè)表中沒有對應(yīng)匹配項時,tableau將以 null 值填充。

4. 完全外部連接

使用完全外部聯(lián)接來合并表時,生成的表將包含兩個表中的所有值。

當(dāng)任一表中的值在另一個表中沒有匹配項時,tableau將以 null 值填充。

注意到在數(shù)據(jù)表的列表下方有一個“新建并集”的按鈕,新建并集的意思是指將一個表中的幾行數(shù)據(jù)附加到另一個表來合并兩個或更多表的另一種方法。通常情況下,需要合并的表必須具有相同的字段數(shù),并且這些字段必須具有匹配的名稱和數(shù)據(jù)類型。

完成數(shù)據(jù)連接以后,進入工作表1,tableau已經(jīng)自動把數(shù)據(jù)劃分為維度和度量了,當(dāng)然這個也可以自行調(diào)整,將order date拖入列,sales拖入行,tableau自動給order date按照年來進行劃分,而對sales進行按年份的求和處理。

注意到order date是按年統(tǒng)計的,在年前面有一個“+”,點擊這個加號,就會按更細粒度的時間范圍進行統(tǒng)計?;蛘唿c擊“+”后面的區(qū)域,會彈出對話框,如下圖所示:


注意到有兩個“季度”可供選擇,如果選擇了上面一個“季度”,tableau會將每年的相應(yīng)季度的銷售額加起來,如果選擇了下面一個,則只求和某一個具體年份的銷售額,“月”,“周”,“日”是類似的原理。

單擊其中的編輯篩選器,可以對order date的日期進行篩選。里面的選項都很好理解,不再贅述。

單擊最下面的“在功能區(qū)中編輯”,會發(fā)現(xiàn)列中order date顯示變成了“DATEPART('year', [Order Date])",可知tableau對order date的組織方式也是有相關(guān)公式的,至于這些公式如何用,我們后面再深究。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容