(02)MapReduce與Spark的異同和優(yōu)勢(shì)比較

MapReduce與Spark相比,有哪些異同點(diǎn)

? ? 1、基本原理上:

? ? ? ? a) MapReduce:基于磁盤的大數(shù)據(jù)批量處理系統(tǒng)。

? ? ? ? b) Spark:基于RDD(Resilient Distributed Datasets,彈性分布式數(shù)據(jù)集)數(shù)據(jù)處理,顯式的將RDD數(shù)據(jù)存儲(chǔ)到磁盤和內(nèi)存中。

? ?2、模型上:

? ? ? ? a) MapReduce:可以處理超大規(guī)模的數(shù)據(jù),適合日志分析挖掘等較少的迭代的長(zhǎng)任務(wù)需求;結(jié)合了數(shù)據(jù)的分布式的計(jì)算。

? ? ? ? b) Spark:適合數(shù)據(jù)的挖掘,機(jī)器學(xué)習(xí)等多輪迭代式計(jì)算任務(wù)。

????3、容錯(cuò)性上:

? ????? a) 數(shù)據(jù)容錯(cuò)性

? ? ? ? b) 節(jié)點(diǎn)容錯(cuò)性

? ? ? ? Spark Lineage,在數(shù)據(jù)發(fā)生丟失時(shí),可以從Lineage上重構(gòu)數(shù)據(jù)結(jié)構(gòu)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容