????今天想和大家聊一聊關(guān)于數(shù)據(jù)分析與可視化,鑒于才疏學(xué)淺,對(duì)大數(shù)據(jù)的底層就不瞎嗶嗶了。結(jié)合自己的一些實(shí)踐經(jīng)驗(yàn)談一談最上層的數(shù)據(jù)BI分析與展示,也就是下圖數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)圖中數(shù)據(jù)可視化的部分,順便對(duì)比幾個(gè)工具的特性。
?既然是漫談,所以想到什么就說(shuō)什么,并不成體系。
????????拋開(kāi)大數(shù)據(jù)的概念不談,很多公司多少是有一些數(shù)據(jù)的積累,但是對(duì)數(shù)據(jù)分析上停留在了“最后一公里”。有很多日志、有原始數(shù)據(jù)庫(kù)、有線(xiàn)下的各種Excel匯總表。
????數(shù)據(jù)分析用Excel可以嗎? 當(dāng)然可以,就像是一把瑞士軍刀,Excel+VBA加上一些擴(kuò)展可以做很多數(shù)據(jù)分析工作。 玩轉(zhuǎn)Excel是必須的,數(shù)據(jù)公式、圖表、透視表是基礎(chǔ),會(huì)VBA算是加分項(xiàng)。新手通過(guò)Excel可以入門(mén)基礎(chǔ)的數(shù)據(jù)分析,后期逐漸拓展。
數(shù)據(jù)分析的段位
????前幾天看了一篇文章,說(shuō)到數(shù)據(jù)分析師有四個(gè)段位,各個(gè)段位對(duì)數(shù)學(xué)、數(shù)據(jù)分析工具、編程、有不同的技能要求。
數(shù)據(jù)分析專(zhuān)員
進(jìn)階數(shù)據(jù)分專(zhuān)員
數(shù)據(jù)分析師
數(shù)據(jù)科學(xué)家 / 數(shù)據(jù)挖掘工程師 / 數(shù)據(jù)可視化工程師
????會(huì)SQL、SPSS、R和Python會(huì)一兩種,可視化BI工具Tableau / Power BI / 熟練使用,基礎(chǔ)的統(tǒng)計(jì)學(xué)熟練,對(duì)了,PPT和Excel一定要用得溜,再加上熟悉業(yè)務(wù),就已經(jīng)能滿(mǎn)足大多數(shù)傳統(tǒng)公司和互聯(lián)網(wǎng)公司的業(yè)務(wù)要求了 。
????首先我們得有數(shù)據(jù)分析的數(shù)據(jù)來(lái)源,就KK目前公司里面存在的數(shù)據(jù)來(lái)源有以下幾類(lèi):
服務(wù)器日志,包括App、后臺(tái)系統(tǒng)所有的操作日志,數(shù)據(jù)量最大,存儲(chǔ)在服務(wù)器上
業(yè)務(wù)數(shù)據(jù)庫(kù),主要是幾項(xiàng)主要業(yè)務(wù)的訂單數(shù)據(jù),客戶(hù)數(shù)據(jù)等。在 Mysql中
接口數(shù)據(jù),HTTP、FTP 數(shù)據(jù),主要是其他合作接口提供數(shù)據(jù)
線(xiàn)下Excel報(bào)表,這部分?jǐn)?shù)據(jù)雜亂,整理耗費(fèi)的人力最大
????在整理匯集抽取清洗各種數(shù)據(jù)源的過(guò)程是最艱難(惡心)的,通常因?yàn)榉植荚诓煌牡胤?,而且不是統(tǒng)一的結(jié)構(gòu),甚至不是結(jié)構(gòu)化的數(shù)據(jù)。大一點(diǎn)的公司會(huì)搭建數(shù)據(jù)倉(cāng)庫(kù),按照上面的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)圖進(jìn)行數(shù)據(jù)歸集,這個(gè)我沒(méi)有發(fā)言權(quán)就略過(guò)~
? ? ?然后說(shuō)一說(shuō)圖表的類(lèi)型,柱狀圖、條形圖、散點(diǎn)圖、玫瑰圖、雷達(dá)圖等,一圖勝千言。按照不同的目的,根據(jù)上圖選擇下方對(duì)應(yīng)的圖表就可以了。
????在實(shí)際分析的過(guò)程中其實(shí)是多種圖表套用。舉個(gè)例子,分析一個(gè)總銷(xiāo)售額下每個(gè)各條業(yè)務(wù)線(xiàn)的組成,可以用餅狀圖/環(huán)形圖,如果要加上時(shí)間維度的話(huà)就可以選用 折線(xiàn)圖或者面積圖。

????數(shù)據(jù)分析的過(guò)程就是使用各種工具對(duì)數(shù)據(jù)進(jìn)行抽取分析發(fā)現(xiàn)問(wèn)題不斷深入的過(guò)程,目前在數(shù)據(jù)分析的工具上有一個(gè)趨勢(shì)是自助式分析,使用數(shù)據(jù)可視化BI工具連接數(shù)據(jù)源或者導(dǎo)入數(shù)據(jù)后使用可視化的操作,所見(jiàn)即所得的分析方式。
Tableau?,這個(gè)是KK用得最多的,而且也是數(shù)據(jù)BI領(lǐng)域的老大哥了,在國(guó)外很火,但是在國(guó)內(nèi)本土化上面還有待提高,產(chǎn)品是好產(chǎn)品。收費(fèi),有試用期可以體驗(yàn)。
Fine report \ Fine BI,帆軟是國(guó)內(nèi)做BI本土化做得比較好的公司,使用上也比較不錯(cuò)。
Microsoft Power BI?,Excel是數(shù)據(jù)分析可視化的鼻祖。近些年,微軟基于Excel開(kāi)發(fā)了Power BI的一系列插件。
BDP個(gè)人版,類(lèi)似tableau 但是個(gè)人感覺(jué)在數(shù)據(jù)分析上略弱,適用于簡(jiǎn)單的數(shù)據(jù)類(lèi)型,漏斗圖、詞云、桑基圖、熱力地圖比較有特點(diǎn)。
數(shù)據(jù)觀,國(guó)內(nèi)的一款BI工具,免費(fèi)試用一個(gè)月,數(shù)據(jù)量大時(shí)處理上不如上面幾個(gè),可以結(jié)合自己情況試用。

????其實(shí)這幾款工具只要會(huì)其中的一款,其他的操作上大同小異,使用上學(xué)習(xí)起來(lái)也會(huì)很容易。 需要的是針對(duì)自身的數(shù)據(jù)情況選擇合適的一兩款就可以。
對(duì)業(yè)務(wù)人員來(lái)說(shuō)通過(guò)簡(jiǎn)單的拖拽、鉆取、組合就可以處理數(shù)據(jù)進(jìn)行可視化的分析,創(chuàng)建自己需要的報(bào)表、圖表的等,不用所有需求都排到數(shù)據(jù)分析師那里。
對(duì)數(shù)據(jù)分析師來(lái)說(shuō),完全可以直接根據(jù)需求搭建一個(gè)可交互的Dashboard,在交互效果和顯示上會(huì)比靜態(tài)的Excel更直觀,更新一鍵操作。下圖是我根據(jù)公司業(yè)務(wù)搭建的數(shù)據(jù)監(jiān)控儀表板,可以實(shí)現(xiàn)數(shù)據(jù)鏈接動(dòng)態(tài)變化,另外是一些案例。
可以直接選擇相應(yīng)的tab項(xiàng)變換數(shù)據(jù)源,鏈接數(shù)據(jù)源,實(shí)時(shí)更新也是可以的(下面幾個(gè)是Fine BI 實(shí)現(xiàn)的)

數(shù)據(jù)分析語(yǔ)言
????對(duì)于可視化的實(shí)現(xiàn),除了通過(guò)上面的拖拽還有通過(guò)編程進(jìn)行數(shù)據(jù)分析。其中R、python是提及比較多的兩種語(yǔ)言
????python之前有一點(diǎn)點(diǎn)的基礎(chǔ),不過(guò)都快忘了,最近開(kāi)始學(xué)習(xí)R語(yǔ)言,主要是幾個(gè)數(shù)據(jù)可視化的模塊。
總結(jié)一下
????數(shù)據(jù)能反映出業(yè)務(wù)中的問(wèn)題,而可視化是將問(wèn)題快速的展示出來(lái)的好方法(ps:有一句話(huà)說(shuō)的是給專(zhuān)業(yè)的人看表,給不專(zhuān)業(yè)的人看圖,哈哈哈),數(shù)據(jù)分析過(guò)程其實(shí)很有意思,抽絲剝繭一般分析數(shù)據(jù),選擇合適的圖進(jìn)行展示。
在數(shù)據(jù)分析的各個(gè)階段可以選擇使用的工具如下圖,有編程基礎(chǔ)的可以選擇代碼型,沒(méi)有代碼基礎(chǔ)的選擇界面型妥妥的。
? 上圖數(shù)據(jù)可視化方面再補(bǔ)充幾個(gè):Power BI 、BDP、Fine-BI、QlikView
所以,在Excel 之外還有一大堆的數(shù)據(jù)分析、可視化的工具可以選擇。各個(gè)工具有各個(gè)工具的特性,數(shù)據(jù)分析的核心不變,哪個(gè)工具能節(jié)省我們的時(shí)間我們就用哪個(gè)。當(dāng)你熟悉了其中的一款,學(xué)習(xí)另一款就是一兩天的事。
? ? ? ?對(duì)了最后最后安利部電影,最近熱映的《頭號(hào)玩家》?有條件上4D的一定要上,IMAX的其次??磳?dǎo)演就是一句話(huà):“我,斯皮爾伯格,買(mǎi)票!”
數(shù)據(jù)分析入門(mén)書(shū)籍推薦
1、《Head First Statistics》:深入淺出統(tǒng)計(jì)學(xué)
2、《數(shù)據(jù)之魅-基于開(kāi)源工具的數(shù)據(jù)分析》
3、《數(shù)據(jù)挖掘-市場(chǎng)營(yíng)銷(xiāo)、銷(xiāo)售與客戶(hù)關(guān)系管理領(lǐng)域應(yīng)用》
4、《R語(yǔ)言實(shí)戰(zhàn)》
5、《精益數(shù)據(jù)分析》
推薦閱讀:
產(chǎn)品經(jīng)理日常使用工具-基礎(chǔ)必備篇
產(chǎn)品經(jīng)理日常使用工具-高級(jí)加分篇
關(guān)于App數(shù)據(jù)埋點(diǎn)那些事兒
品質(zhì)二手書(shū)平臺(tái)—多抓魚(yú)體驗(yàn)報(bào)告
產(chǎn)品數(shù)據(jù)運(yùn)營(yíng)-海盜指標(biāo)及三個(gè)增長(zhǎng)方法
????我是KK 李kui,分享一些產(chǎn)品的看法,工具或者資料,贈(zèng)人玫瑰 手有余香~