【Mac大數(shù)據(jù)開發(fā)】第五篇-分布式集群和免密登陸

1. 集群配置

此前使用的是偽分布式的單機(jī)模式,本篇使用分布式的集群配置。
配置方案如下:

bigdata1 bigdata2 bigdata3
HDFS NameNode SecondaryNameNode DataNode DataNode DataNode
YARN nodeManager ResourceManger NodeManager nodeManager

修改對應(yīng)的配置文件即可。
同時(shí)更改hadoop的/etc目錄下的slaves,添加三個(gè)節(jié)點(diǎn)的hostname。
(配置很多,配好一個(gè)scp同步給另外兩臺服務(wù)器即可)
如果此前使用了單機(jī)偽分布式集群的模式,注意此時(shí)要?jiǎng)h除data目錄和logs目錄,重新format,否則后續(xù)啟動(dòng)會(huì)報(bào)錯(cuò)。

2. 配置免密登陸

為什么配置免密登陸?
不配置免密登陸,hadoop集群間的很多操作都需要輸入密碼,十分不方便
設(shè)置方式:

  1. 在三臺服務(wù)器上分別生成公私鑰
ssh-keygen -t rsa

生成過程中不需要輸入任何二次密碼,全部回車確認(rèn)

  1. 分別復(fù)制公鑰到指定服務(wù)器
ssh-copy-id bigdata1
ssh-copy-id bigdata2
ssh-copy-id bigdata3

以上完成免密登陸配置

3. 啟動(dòng)集群

在分布式集群環(huán)境中,hdfs和yarn,都需要在配置中指定的namenode和resourcemanager服務(wù)器啟動(dòng)-主節(jié)點(diǎn)。其他從節(jié)點(diǎn)會(huì)自動(dòng)啟動(dòng)
首先啟動(dòng)hdfs系統(tǒng),在data1服務(wù)器上使用指令

sbin/start-dfs.sh

第二步,啟動(dòng)yarn ResourceManager,在data2上執(zhí)行

sbin/start-yarn.sh

注意:不能再使用start-all腳本,該腳本會(huì)啟動(dòng)當(dāng)前節(jié)點(diǎn)的所有功能。
啟動(dòng)后,通過web控制端訪問可以看到如下頁面,則集群搭建成功


yarn集群效果

測試上傳文件,看到3個(gè)副本


上傳文件測試

4. Hadoop的Demo測試

Hadoop的share/hadoop/mapreduce目錄下,官方提供了一些例子,使用wordcount進(jìn)行測試(統(tǒng)計(jì)text文件中的單詞個(gè)數(shù))
使用指令-解析test.txt輸出到out目錄

hadoop jar hadoop-mapreduce-examples-2.8.4.jar wordcount /test.txt /out

通過web端和命令行都可以看到執(zhí)行結(jié)果


生成out目錄下的文件
統(tǒng)計(jì)結(jié)果

注意:在使用虛擬機(jī)過程中,一定要先關(guān)閉hadoop再關(guān)閉虛擬機(jī),否則會(huì)造成datanode異常

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容