1991年,比爾·恩門(mén)(Bill Inmon)出版了他的第一本關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的書(shū)《Building the Data Warehouse》,標(biāo)志著數(shù)據(jù)倉(cāng)庫(kù)概念的確立。我們所常說(shuō)...
2017年柏林Flink Forward大會(huì)上Robert Metger的"Keep It Going: How to Reiably and Efficiently Ope...
留存簡(jiǎn)單來(lái)說(shuō)就是某天的注冊(cè)用戶(hù)有多少人在多少天后還在繼續(xù)使用,但具體的定義各個(gè)公司可能都不太一樣,比如三日留存是在第四天還有登陸的玩家,一天是按現(xiàn)實(shí)的0點(diǎn)為分界還是一個(gè)玩家完...
1 bucket-mapjoin 1.1 條件1) set hive.optimize.bucketmapjoin = true;2) 一個(gè)表的bucket數(shù)是另一個(gè)表buc...
偶然讀取到了字節(jié)跳動(dòng)關(guān)于Spark做的一些優(yōu)化,發(fā)現(xiàn)其中一項(xiàng)被稱(chēng)為BuckedtJoin的優(yōu)化項(xiàng) 傳送門(mén):Spark SQL 在字節(jié)跳動(dòng)數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的優(yōu)化實(shí)踐 [https:...
背景 隨著公司業(yè)務(wù)的發(fā)展,慢慢已經(jīng)從做新功能,變成優(yōu)化功能,至于怎么優(yōu)化功能,精細(xì)化運(yùn)營(yíng)已經(jīng)很難直觀判斷。尤其作為裂變?cè)鲩L(zhǎng)組的PM,對(duì)公司現(xiàn)有砍價(jià)、助力、簽到等工具的優(yōu)化,尤...
上一章《埋點(diǎn)需求分析&設(shè)計(jì)埋點(diǎn)方案》已經(jīng)說(shuō)明了什么是埋點(diǎn),埋點(diǎn)需求分析、數(shù)據(jù)指標(biāo)、常見(jiàn)的埋點(diǎn)事件等基本概念。本周主要輸出整理埋點(diǎn)文檔的思路。 一、什么是埋點(diǎn)需求文檔 埋點(diǎn)文檔...
本文首發(fā)于泊浮目的簡(jiǎn)書(shū)[http://www.itdecent.cn/u/204b8aaab8ba]:http://www.itdecent.cn/u/204b8aaab...
Gephi 和網(wǎng)絡(luò)圖 今天要分享的一款網(wǎng)絡(luò)圖工具:Gephi。 你可能沒(méi)聽(tīng)過(guò) Gephi,但說(shuō)起百度的 Echarts和阿里的 Antv Data,一定不陌生。 在這兩款的數(shù)...