從我畢業(yè)進入游戲數(shù)據(jù)分析行業(yè)也有一年多了。
這一年中也接觸到了很多數(shù)據(jù)分析的工具,數(shù)據(jù)處理,數(shù)據(jù)存儲,數(shù)據(jù)可視化之類的東西。
也慢慢積累了一些處理處理的技巧之類的。
這篇專題主要是記錄我在數(shù)據(jù)分析中遇到的一些比較典型的,有價值的處理過程。
主要包括以下工具 :
- BigQuery標(biāo)準(zhǔn)SQL,文檔: Bigquery官方SQL文檔
- Pandas,文檔:Pandas官方文檔
- Looker,文檔:Looker官方文檔
Bigquery是google的云數(shù)據(jù)庫,功能非常強大,不過要翻墻。
Looker是一個BI工具,19年被Google以26億刀收購,成為Google生態(tài)的一環(huán)。
它的使用和Tableu差不多,不過Looker是純web端的。
Pandas是Python的數(shù)據(jù)分析庫,在數(shù)據(jù)量不大的時候配合Jupyter是我認(rèn)為數(shù)據(jù)探索最強大的工具,yyds。
后面大多數(shù)情況是給出一個真實的需求,
有的是用SQL做的,有的是用Pandas做的,有些會涉及到Looker的LookML語法。
這些東西主要作為個人的記錄,分享那些倒是次要的,畢竟國內(nèi)用到Bigquery+Looker的人應(yīng)該不多。
不過Bigquery的語法和Mysql的也比較相似,而Looker的用法和Tableu也差不太多,也可以參考參考。
還有因為是個人的記錄,所以不會有太基礎(chǔ)的東西,大多是帶技巧性的東西。