Apache Spark的工作原理
1 Why Apache Spark
2 關(guān)于Apache Spark
3 如何安裝Apache Spark
4 Apache Spark的工作原理
5 spark彈性分布式數(shù)據(jù)集
6 RDD持久性
7 spark共享變量
8 Spark SQL
9 Spark Streaming
Spark引擎提供了一種在一組機(jī)器上分布式內(nèi)存中處理數(shù)據(jù)的方法。圖7顯示了典型的Spark作業(yè)如何處理信息的邏輯圖。


主控制如何分割數(shù)據(jù),并利用數(shù)據(jù)位置,同時(shí)跟蹤從機(jī)上的所有分布式數(shù)據(jù)計(jì)算。如果某臺(tái)從機(jī)不可用,該機(jī)器上的數(shù)據(jù)將在其他可用的機(jī)器上重建?!按髱煛蹦壳笆且粋€(gè)單一的失敗點(diǎn),但將在即將發(fā)布的版本中修復(fù)。
公眾號(hào):it全能程序猿
