11 sparkstreaming監(jiān)控端口信息

前面我們已經(jīng)了解了sparksql的使用,這一節(jié)我們將了解spark當中的流處理即spark-streaming。

1 系統(tǒng)、軟件以及前提約束

  • CentOS 7 64 工作站 作者的機子ip是192.168.100.200,請讀者根據(jù)自己實際情況設置
  • 已完成spark中的DataFrame編程
    http://www.itdecent.cn/nb/37554943
  • xshell
  • 為去除權(quán)限對操作的影響,所有操作都以root進行
  • 確保hadoop,spark已經(jīng)啟動

2 操作

  • 1 在linux命令行中執(zhí)行以下命令
# 啟動8888端口,可以輸入值
nc -lk 8888
  • 2 啟動另外一個窗口,執(zhí)行以下命令:
# 進入spark的bin目錄
cd /root/spark-2.2.1-bin-hadoop2.7/bin
# 進入scala命令行
./spark-shell
# 在命令行中執(zhí)行以下語句
import org.apache.spark._ 
import org.apache.spark.streaming._ 
import org.apache.spark.storage.StorageLevel

val ssc = new StreamingContext(sc, Seconds(1))
val lines = ssc.socketTextStream("192.168.100.200", 8888, StorageLevel.MEMORY_AND_DISK_SER)
val wordCounts = lines.flatMap(_.split(" ")).map(x => (x, 1)).reduceByKey(_ + _).print() 
ssc.start() 
ssc.awaitTermination()
  • 3 測試
    在前一個nc窗口不斷輸入字符串,回車,我們會看到spark命令行中正在統(tǒng)計這一秒的輸入的字符串的詞頻。
    以上,就是sparkstreaming監(jiān)聽端口并進行詞頻統(tǒng)計的過程。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 1. Overview: Structured Streaming是基于Spark SQL引擎的可擴展、具有容錯性...
    奉先閱讀 3,033評論 0 1
  • Zookeeper用于集群主備切換。 YARN讓集群具備更好的擴展性。 Spark沒有存儲能力。 Spark的Ma...
    Yobhel閱讀 7,605評論 0 34
  • 官網(wǎng) 中文版本 好的網(wǎng)站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,723評論 0 5
  • 你認識的志玲是什么樣子的呢?小能量體、女神/經(jīng)還是小太陽? 可我認識的志玲有點不一樣。 她非常固執(zhí)。在俱樂部,總些...
    小亭子R閱讀 550評論 1 2
  • 曾經(jīng)喜歡一個人旅行。 后來發(fā)現(xiàn)水晶球簡直是拍照神器。 美麗的風景,畫面都可以定格在小小的水晶球里面。 望大家喜歡。...
    喪喪的咸魚閱讀 628評論 1 3

友情鏈接更多精彩內(nèi)容