教程簡(jiǎn)介
MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想,都是從函數(shù)式編程語(yǔ)言里借來(lái)的,還有從矢量編程語(yǔ)言里借來(lái)的特性。它極大地方便了編程人員在不會(huì)分布式并行編程的情況下,將自己的程序運(yùn)行在分布式系統(tǒng)上。 當(dāng)前的軟件實(shí)現(xiàn)是指定一個(gè)Map(映射)函數(shù),用來(lái)把一組鍵值對(duì)映射成一組新的鍵值對(duì),指定并發(fā)的Reduce(歸約)函數(shù),用來(lái)保證所有映射的鍵值對(duì)中的每一個(gè)共享相同的鍵組。
MapReduce入門(mén)教程 - 從簡(jiǎn)單的步驟了解MapReduce,從基本到高級(jí)概念,包括簡(jiǎn)介,算法,安裝,API,Hadoop中的實(shí)現(xiàn),分區(qū)器,組合器,Hadoop管理。
教程目錄
- MapReduce教程
- MapReduce - 簡(jiǎn)介
- MapReduce - 算法
- MapReduce - 安裝
- MapReduce - API
- MapReduce - Hadoop實(shí)現(xiàn)
- MapReduce - 分區(qū)程序
- MapReduce - 組合器
- MapReduce - Hadoop管理
- MapReduce - 有用的資源