本博客是筆者在生產(chǎn)環(huán)境使用 Flink 遇到的 Checkpoint 相關故障后,整理輸出,價值較高的 實戰(zhàn)采坑記,本文會帶你更深入的了解 Flink 實現(xiàn)增量 Checkp...
Apache Kylin核心思想 簡單來說,Kylin的核心思想是預計算,用空間換時間,即對多維分析可能用到的度量進行預計算,將計算好的結果保存成Cube,供查詢時直接訪問。...
本文來自一位不愿意透露姓名的粉絲投稿 相信很多人對于MySQL的索引都不陌生,索引(Index)是幫助MySQL高效獲取數(shù)據(jù)的數(shù)據(jù)結構。 因為索引是MySQL中比較重點的知識...
雖然一直在接觸這些專業(yè)的名詞,但是一直理解的不深刻,所以今天特地查了一些官方解釋和很多優(yōu)秀的博客文章,將關于這些方面的理解記了下來,先將這些簡稱做一個解釋: 1、DB(Dat...
Map Reduce & YARN 簡介 Apache Hadoop 是一個開源軟件框架,可安裝在一個商用機器集群中,使機器可彼此通信并協(xié)同工作,以高度分布式的方式共同存儲和...
通過閱讀本文,可以讓你快速了解數(shù)倉如何分層,合理,實用。筆者堅持原創(chuàng),根據(jù)實踐總結,希望對新手有所幫助。 分層案例 1.電信通訊stage層 ->bdl層 ->analysi...
概述 維度建模法(Dimensional Modeling)是數(shù)據(jù)倉庫建模中比較常用的方法,最常見的數(shù)據(jù)模式包括 星型模式(Star Schema)、雪花模式(Snowfla...
本文內(nèi)容基于Spark最新版1.6.1 Spark 最初只有Spark Core,通過逐步的發(fā)展,現(xiàn)在已擴展出Spark SQL、Spark Streaming、Spark ...
案例來源:http://homepage.cs.latrobe.edu.au/zhe/ZhenHeSparkRDDAPIExamples.html Spark算子大致上可分三...
Spark Streaming 編程指南1.概述Spark Streaming 是 Spark Core API 的擴展, 它支持彈性的, 高吞吐的, 容錯的實時數(shù)據(jù)流的處理...