HDFS 分布式文件系統(tǒng),存儲海量的數(shù)據(jù)
MapReduce 并行處理框架,實現(xiàn)任務(wù)分解和調(diào)度
高擴展,低成本,成熟的生態(tài)圈
設(shè)置環(huán)境變量
修改配置文件
core
map
hdfs
hadoop-env
slaves
hdfs的文件被分成塊進行存儲,hdfs塊的默認(rèn)大小是64M,塊是文件存儲處理的邏輯單元
namenode是管理節(jié)點,存放文件元數(shù)據(jù)(文件和數(shù)據(jù)塊的映射表,數(shù)據(jù)塊和數(shù)據(jù)節(jié)點的映射表)
datanode是hdfs的工作節(jié)點,存放數(shù)據(jù)塊
datanode定期向namenode發(fā)送心跳信息
二級namenode定期同步元數(shù)據(jù)映像文件和修改日志
hdfs特點:數(shù)據(jù)冗余,硬件容錯;流式的數(shù)據(jù)訪問(寫一次,讀多次);存儲大文件
適用性和局限性:適合數(shù)據(jù)批量讀寫,吞吐量高;不適合交互式應(yīng)用,低延遲很難滿足;適合一次寫入,多次讀取;不支持多用戶并發(fā)寫相同文件
hadoop namenode -format
hadoop fs -ls /
hadoop fs -put src dst
hadoop dfsadmin -report
MapReduce 分而治之 map分,reduce合并
JOB 分成多個 TASK(MapTask和ReduceTask)
JobTracker 分成TaskTracker(MapTracker和ReduceTracker)
JobTracker:作業(yè)調(diào)度;分配任務(wù)、監(jiān)控任務(wù)執(zhí)行的狀態(tài);監(jiān)控TaskTracker的狀態(tài)
TaskTracker:執(zhí)行任務(wù);匯報任務(wù)狀態(tài)
MapReduce的容錯機制:重復(fù)執(zhí)行;推測執(zhí)行;
2、Hadoop
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 1.job的本質(zhì)是什么? 2.任務(wù)的本質(zhì)是什么? 3.文件系統(tǒng)的Namespace由誰來管理,Namespace的...
- 最近看了朋友推薦的一部日本動畫《命運石之門》,講訴的是一位中二少年自稱自己為瘋狂科學(xué)家偶然發(fā)明時間機器,然后拯救世...