pull 鏡像 啟動容器
事務(wù)的概念 事務(wù)是數(shù)據(jù)庫并發(fā)控制的基本單位 事務(wù)可以看作是一系列SQL語句的集合 事務(wù)必須要么全部成功,要么全部執(zhí)行失敗(回滾) 事務(wù)的四個基本特性 (ACID) 原子性(A...
測試表數(shù)據(jù) user_login 表 該表表示,用戶登錄的日期 user_name 表 該表記錄 id 和對應(yīng)的姓名 over() 函數(shù) 所謂窗口函數(shù),就是在sql 執(zhí)行到...
Spark 通用問題 任務(wù)提交流程 用戶創(chuàng)建Spark程序并提交 每個action會生成一個job,包含了一系列的RDD和對其如何進(jìn)行操作的transformation 每個...
Hadoop 架構(gòu) Hadoop組成部分 HDFS管理者:namenode工作者:DataNode輔助管理者:secondaryNameNode MapReduce YARN...
Hadoop 的組成 HDFS管理者:namenode工作者:DataNode輔助管理者:secondaryNameNode MapReduce YARN管理者:Resour...
1.Python是一門面向?qū)ο蟮恼Z言,在Python中一切皆對象 2.一個Python算法應(yīng)該具有以下七個重要的特征: 1.有窮性(Finiteness):算法的有窮性是指算...
劍指 Offer 03. 數(shù)組中重復(fù)的數(shù)字[https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-...
概念 RDD(Resilient Distributed Dataset)叫做彈性分布式數(shù)據(jù)集,是 Spark 中最基本的數(shù)據(jù)處理模型。代碼中是一個抽象類,它代表一個彈性的、...
Spark 核心模塊 Spark Core : 提供了 Spark 最基礎(chǔ)與最核心的功能,Spark 其他的功能如:Spark SQL,Spark Streaming,Gra...
前言 word count 相當(dāng)于大數(shù)據(jù)領(lǐng)域的 Hello word,以此為入門案例需求: 輸入字符串,最后側(cè)輸出每個字符串出現(xiàn)的次數(shù) ,關(guān)于各種算子,后續(xù)會詳細(xì)記錄,本篇...
Flink 中的狀態(tài) 算子狀態(tài) (Operator State) 鍵控狀態(tài) (Keded State) 狀態(tài)后端 (State Nackends) 由一個任務(wù)維護(hù),用來計算耨...
案例說明 輸入數(shù)據(jù)為 “訂單,課程,下單時間”,需求為找到下單每10秒內(nèi),每個課程的最早下單時間,watermark設(shè)置為 2秒 代碼 env.setStreamTimeCh...
Flink 中的時間語義 Event Time : 事件創(chuàng)建的時間 Ingestion Time: 數(shù)據(jù)進(jìn)入 Flink 的時間 Processing Time: 執(zhí)行操作算...