隨著數(shù)據(jù)量越來越大,依賴于數(shù)據(jù)決策的場景越來越多,使用工具對(duì)于數(shù)據(jù)進(jìn)行分析,越來越成為一個(gè)職場人必備的一項(xiàng)技能。那么如果要更自如的進(jìn)行數(shù)據(jù)分析,就必須掌握幾個(gè)數(shù)據(jù)分析常用的工具。俗話說的好:工欲善其事必先利其器。那么數(shù)據(jù)分析常備的工具是啥呢?神器組合:xmind + sql+power bi +excel。我自己在實(shí)際工作中也是屢試不爽的。

01 工具包
工具都是有自己的適用場景的,知道什么場景下用什么樣的工具,可以最大程度的提高自己的效率。
各個(gè)工具的使用場景和順序:
02 微軟的商業(yè)智能'利器'
有些人可能對(duì)于POWER BI比較陌生,參考我之前的一篇文章來個(gè)科普貼。我自己是從2018年工作中接觸到POWER BI,自那以后也是比較癡迷于它。
-POWER BI與excel處理邏輯相似,由于它是微軟公司做的商業(yè)智能軟件。
-從excel演變而來,計(jì)算表達(dá)式與excel的函數(shù)表達(dá)式很像,區(qū)別是POWER BI的函數(shù)直接作用于一列或者一張表。
-學(xué)習(xí)成本比SQL和Python都要簡單,基本上能應(yīng)付絕大部分?jǐn)?shù)據(jù)分析場景。
-本身使用是免費(fèi)的。
03 POWER BI的優(yōu)勢
下面以一個(gè)案例來講下POWER BI使用及優(yōu)勢。
Kaggle上的一個(gè)零售數(shù)據(jù)集:某英國在線零售商8個(gè)月訂單數(shù)據(jù),訂單表,產(chǎn)品維度表(是我隨意打標(biāo)簽的創(chuàng)造的一個(gè)):
stockcode: 產(chǎn)品code,invoiceNo:訂單號(hào),invoicedate:下單日期,unitprice:單價(jià),quantity:數(shù)量,customerid:顧客id;
我們從數(shù)據(jù)分析項(xiàng)目的流程來簡單講下優(yōu)勢(操作步驟見下圖演示):
- 數(shù)據(jù)清洗整理(多數(shù)據(jù)源導(dǎo)入,清理模板,數(shù)據(jù)量大時(shí)候,速度快,數(shù)據(jù)基本空值情況)
可以從多數(shù)據(jù)源導(dǎo)入數(shù)據(jù),本案例導(dǎo)入了csv和excel文件兩種(1&2);然后在power query進(jìn)可以看到列中的空值與錯(cuò)誤值情況(3),用行了清洗,去除空值和負(fù)值,這些清理操作會(huì)被保留下來(4),下次更新數(shù)據(jù)源,不用再操作一遍。
- 數(shù)據(jù)模型建立 - 建立關(guān)系 + 表+ 計(jì)算列 + 度量值 + 計(jì)算應(yīng)用(計(jì)算銷售額)
POWER BI有個(gè)比較重要的功能就是數(shù)據(jù)模型,這個(gè)概念是數(shù)據(jù)倉庫中有的,接地氣點(diǎn)說就是搭建數(shù)據(jù)報(bào)表模板。
我們將兩張表(5)通過stockcode這個(gè)子段建立了關(guān)系(6-vlookup),然后生成新的計(jì)算列‘銷售額’(7),計(jì)算每個(gè)產(chǎn)品的價(jià)格,最后用度量衡聚合SUM函數(shù)計(jì)算來銷售總額(8)。

- 我們用分析常用的視角來可視化探索這個(gè)零售的數(shù)據(jù)。
描述看各個(gè)國家的體量情況(9&10,采用地圖視角);用分解樹細(xì)分定位國家的主要構(gòu)成品類(11&12);看各個(gè)品類的趨勢情況(13&14)最后通過切片可以篩選任意國家的趨勢情況(15&16)。
- 固定化成模板 -可以直接連接數(shù)據(jù)庫。
POWER BI還有強(qiáng)大的功能可以直接連接數(shù)據(jù)庫,然后可以根據(jù)已經(jīng)制作好的模板,處理數(shù)據(jù)呈現(xiàn)想看的結(jié)果,以及建立動(dòng)態(tài)儀表盤等等功能。
如果有興趣入門的話,可以繼續(xù)關(guān)注我的公眾號(hào),后續(xù)會(huì)對(duì)POWER BI進(jìn)行分析專題分享;
歡迎關(guān)注微信公眾號(hào)'數(shù)據(jù)氧氣',回復(fù)【軟件安裝包】,即可獲得文中的數(shù)據(jù)集以及POWER BI安裝包和POWER BI文件。