SparkStreaming-Kafka通過指定偏移量獲取數(shù)據(jù) 1.數(shù)據(jù)源 '310999003001', '31099900300102201...
投稿
收錄了1篇文章 · 1人關注
SparkStreaming-Kafka通過指定偏移量獲取數(shù)據(jù) 1.數(shù)據(jù)源 '310999003001', '31099900300102201...
專題公告
Spark Streaming 用于流式數(shù)據(jù)的處理。Spark Streaming 支持的數(shù)據(jù)輸入源很多,例如:Kafka、Flume、Twitter、ZeroMQ 和簡單的 TCP 套接字等等。數(shù)據(jù)輸入后可以用 Spark 的高度抽象原語如:map、reduce、join、window 等進行運算。而結果也能保存在很多地方,如 HDFS,數(shù)據(jù)庫等。和 Spark 基于 RDD 的概念很相似,Spark Streaming 使用離散化流(discretized stream)作為抽象表示,...
展開描述