1.Apache beam 是google和其合作伙伴開源的新的流式大數(shù)據(jù)分析模式,目前支持如下的引擎:

beam支持的相關引擎
2.執(zhí)行過程

beam的執(zhí)行過程
1.選擇自己喜歡的編程語言編寫程序提交
2.該編程語言必須對應相應beam的sdk
3.轉換成beam可以識別的格式以便于執(zhí)行
4.在分布式環(huán)境中支持beam的數(shù)據(jù)處理管道
5.在beam的管道中處理所有的應用
6.創(chuàng)建一個高階的數(shù)據(jù)處理管道
ps:目前beam提供的sdk有java 和 python。
3.安裝
直接在github或者本地git下來beam工程,然后進行mvn打包,如下圖:

mvn下載word-count程序
運行word-count程序得到輸出結果:

不同引擎選擇不同的執(zhí)行命令
得到輸出結果

輸出結果