“ 一切都會過去!除了羊的第二關(guān)....” 今天,你“羊”了嗎?這應(yīng)該是最近出現(xiàn)頻次最多的用語了吧!“羊了個羊”是最近非?;鸨囊豢钗⑿判∮螒?。它火到什么程度?火到上線2天服...
“ 一切都會過去!除了羊的第二關(guān)....” 今天,你“羊”了嗎?這應(yīng)該是最近出現(xiàn)頻次最多的用語了吧!“羊了個羊”是最近非?;鸨囊豢钗⑿判∮螒?。它火到什么程度?火到上線2天服...
前言 我們知道,F(xiàn)link 程序的執(zhí)行是在我們調(diào)用 env.execute() 后才會真正開始。事實上,我們在編寫業(yè)務(wù)代碼時,是在勾勒程序執(zhí)行的 DAG 圖,當調(diào)用 exec...
回顧 Flink 因其高吞吐、低延時、有狀態(tài)、高容錯的特性越來越受到數(shù)據(jù)從業(yè)者的青睞,它彌補了Storm、Spark 的很多不足。作為一個實時計算的框架,F(xiàn)link 在實時數(shù)...
回顧 在之前的學(xué)習(xí)中我們了解到,flink 作為低延時的流式數(shù)據(jù)處理框架,本身是有狀態(tài)的。狀態(tài) state 是為了保存一些操作符 operator 的中間結(jié)果,同時,通過狀態(tài)...
數(shù)據(jù)倉庫介紹 數(shù)據(jù)倉庫是集成的、面向主題的、反應(yīng)歷史的數(shù)據(jù)的集合。它需要具有高效查詢、高質(zhì)量的、可擴展的的特性。數(shù)據(jù)倉庫是協(xié)助運營及管理人員及時做出策略調(diào)整的最有效的依據(jù)。 ...
flink 回顧 通過之前的了解,我們知道,flink是一個高吞吐、低延時的流式處理框架。flink 中具有嚴格的時間定義,采用不同的時間機制,對于其處理延時及處理結(jié)果的準確...
flink 抽象分層結(jié)構(gòu) flink 作為流式處理框架,不僅具有高效的流數(shù)據(jù)和批數(shù)據(jù)處理性能,具有針對開發(fā)人員使用的高效的底層API,同時有方便分析人員使用的 table/s...
Apache flink 簡介 Apache flink 是分布式流式數(shù)據(jù)處理框架,主要用于有界(bounded)和無界(unbounded)數(shù)據(jù)流的有狀態(tài)處理,具有高性能、...
flink Sink簡介 flink 中有兩個重要的概念,Source 和 Sink ,Source 決定了我們的數(shù)據(jù)從哪里產(chǎn)生,而 Sink 決定了數(shù)據(jù)將要去到什么地方。 ...
flink 簡介 flink 是最近幾年發(fā)展最為迅速的實時計算框架,它解決了 storm 低吞吐量的問題,同時也解決了 spark 的高延時問題。flink 是一款高吞吐量、...
問題描述 錯誤原因:這里錯誤發(fā)生的地方使用了一個 tuple 元組,且沒有指定泛型。 錯誤代碼 解決方案 在 tuple 元組使用時指定泛型。 正確代碼
數(shù)據(jù)傾斜的主要表現(xiàn)形式 reducer 階段一直卡在99.9%,但是一直不能結(jié)束。 大量數(shù)據(jù)進入某個或者某幾個reducer中處理,遠遠超過正常的reducer。 某幾個co...
order by 語法操作 order by 是進行全局排序,在整個作業(yè)執(zhí)行過程中,只產(chǎn)生一個 reducer,在數(shù)據(jù)量過大的時候,執(zhí)行的時間會很長 。事實上,這與分布式的思...
窗口函數(shù)通常是分析人員使用 hive ql 進行一些復(fù)雜邏輯計算時使用的特殊函數(shù),其中 over() 通常與聚合函數(shù)共同使用,比如 count()、sum()、min()、m...
問題描述 近期在redis的使用中出現(xiàn)下面的問題: 這個問題描述的很清楚,redis的配置是保存數(shù)據(jù)庫快照,但是在執(zhí)行時不能將數(shù)據(jù)持久化到磁盤。 解決方法 簡單的解決方案: ...
hive 是一款基于 hadoop 的、提供結(jié)構(gòu)化數(shù)據(jù)組織及查詢的數(shù)據(jù)倉庫工具,它提供了 Hive ql方言,使用簡單的 sql 就能解決大多數(shù)的數(shù)據(jù)查詢工作,使得復(fù)雜的 m...