4.Apache Spark的工作原理

Apache Spark的工作原理


1 Why Apache Spark
2 關(guān)于Apache Spark
3 如何安裝Apache Spark
4 Apache Spark的工作原理
5 spark彈性分布式數(shù)據(jù)集
6 RDD持久性
7 spark共享變量
8 Spark SQL
9 Spark Streaming

原文鏈接:http://blogxinxiucan.sh1.newtouch.com/2017/07/23/Apache-Spark%E7%9A%84%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/

Spark引擎提供了一種在一組機(jī)器上分布式內(nèi)存中處理數(shù)據(jù)的方法。圖7顯示了典型的Spark作業(yè)如何處理信息的邏輯圖。

主控制如何分割數(shù)據(jù),并利用數(shù)據(jù)位置,同時(shí)跟蹤從機(jī)上的所有分布式數(shù)據(jù)計(jì)算。如果某臺(tái)從機(jī)不可用,該機(jī)器上的數(shù)據(jù)將在其他可用的機(jī)器上重建?!按髱煛蹦壳笆且粋€(gè)單一的失敗點(diǎn),但將在即將發(fā)布的版本中修復(fù)。


公眾號(hào):it全能程序猿


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容