大數(shù)據(jù)之環(huán)境搭建

配置環(huán)境: centos 7.6 jdk version:1.8.0_171 hadoop version:2.9.2 主機(jī)1名稱:hadoop101
端口號(hào)測(cè)試連通命令: nc -vz -w 2 172.16.9.101 50070 注:需關(guān)閉遠(yuǎn)程主機(jī)防火墻??

一、 jdk與hadoop環(huán)境搭建

1、將jdk與hadoop解壓至/opt/module目錄下,module為自定義文件夾
2、在/etc/profile文件末尾添加如下配置? ? ? ?
##JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_171
export PATH=$PATH:$JAVA_HOME/bin
##HaDOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.9.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
source /etc/profile? 使其生效
3、檢查是否安裝成功命令jdk version、hadoop

二、偽分布模式配置

1、配置java_home環(huán)境變量

?etc/hadoop/hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_171

2、etc/hadoop/core-site.xml:

<configuration>

<!--指定HDFS中NameNode的地址-->

<property>

<name>fs.defaultFS</name>

<value>hdfs://hadoop101:9000</value>

</property>

<!--指定hadoop運(yùn)行時(shí)產(chǎn)生文件的存儲(chǔ)目錄-->

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/module/hadoop-2.9.2/data/tmp</value>

</property>

</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>

<!--配置副本數(shù),默認(rèn)為3-->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

三、啟動(dòng)hdfs

1、bin/hdfs namenode -format? 第一次可格式化數(shù)據(jù),慎用

sbin/hadoop-daemon.sh start namenode? 啟動(dòng)namenode

sbin/hadoop-daemon.sh start datanode? 啟動(dòng)datanode

2、使用hdfs命令范例: 可在hadoop101:50070查看

bin/hdfs dfs + 執(zhí)行命令

創(chuàng)建目錄

bin/hdfs dfs -mkdir -p /user/linan/input

上傳本地文件至hdfs

bin/hdfs dfs -put wcinput/wc.input /user/linan/input/

四、啟動(dòng)yarn

1、配置

1. etc/hadoop/yarn-env.sh 、 mapred-env.sh:export JAVA_HOME=/opt/module/jdk1.8.0_171

etc/hadoop文件夾下重命名: mv mapred-site.xml.template? mapred-site.xml? ? ? ?
2.? ? etc/hadoop/yarn-site.xml:

<!-- reducer 獲取數(shù)據(jù)的方式 -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<!-- 指定yarn的resourceManager的地址 -->

<property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop101</value>

</property>

3. etc/hadoop/mapred-site.xml:

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<!-- 歷史服務(wù)器地址-->

<property>

<name>mapreduce.jobhistory.address</name>

<value>hadoop101:10020</value>

</property>

<!-- 歷史web服務(wù)器地址-->

<property>

<name>mapreduce.jobhistory.webapp.address</name><value>hadoop101:19888</value>

</property>

2、啟動(dòng)

啟動(dòng)resourcemanager

sbin/yarn-daemon.sh start resourcemanager

啟動(dòng)nodemanager

sbin/yarn-daemon.sh start nodemanager

啟動(dòng)歷史服務(wù)器

sbin/mr-jobhistory-daemon.sh start historyserver

五、配置日志聚集

開啟日志聚集功能需重啟nodemanager、resourcemanager、historyserver

1、配置etc/hadoop/yarn-site.xml:

<!-- 開啟-->

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<!-- 日志保留1周-->

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容