Nathan Marz的大作Big Data: Principles and best practices of scalable real-time data system...
整理之前內(nèi)網(wǎng)學(xué)習(xí)的筆記,現(xiàn)在看來也很有價值 1.留存的基礎(chǔ)知識 4月25號有110個新用戶訪問過來,1天后,有29個繼續(xù)訪問。也就說說留存只有29。以此類推。 為什么要關(guān)注留...
說到狀態(tài)管理, 必須要提一下 checkpoint, Flink 中每個函數(shù)和算子都可以是有狀態(tài)的, 有狀態(tài)的函數(shù)需要存儲每個事件的處理過程數(shù)據(jù), 也因為引入狀態(tài), 就不得不...
對于非清洗數(shù)據(jù)類的任務(wù), 時間窗口的使用是很有必要的. 和spark不同, 需要時刻謹記, 這是一個流, 這是一個流, 這是一個流.
1 注意import的StreamExecutionEnvironment // java 的頭是 import org.apache.flink.streaming.api...
首先需要編程應(yīng)用的四層抽象: 最底下的一層對用戶是不可見的, 通過ProcessFunction集成到DataStream API. 我們的編程對象也都是DataStream...
在談Flink之前, 我們在一個更高的層面上來理解一下數(shù)據(jù)的處理, 包括數(shù)據(jù)類型和處理模型兩個大的方面. 首先, 是數(shù)據(jù)的類型 我們把數(shù)據(jù)處理分成兩種模型: 無邊界的數(shù)據(jù): ...
包括內(nèi)容: IK分詞組件的添加和配置 索引建立及高亮搜索示例 添加自定義分詞的測試 版本: ES - 2.4.5, IK - 1.10.5ps: 5.0的版本, 配置和驗證代...
想通過這篇分享, 總結(jié)下用過的一些數(shù)據(jù)可視化方式, 主要是想分享下圖表的一些使用心得. 數(shù)據(jù)可視化其實是一門挺有深度的學(xué)問, 也看過一些書. 這里的內(nèi)容還是從基本的圖表解釋,...