安裝與配置大數(shù)據(jù)軟件

配置所需軟件:

①、VirtualBox-5.2.0-118431-Win.exe

②、Ubuntu14.04.5

③、jdk-8u151-linux-x64.tar.gz

④、hadoop-2.7.3.tar.gz


(一)、下載并安裝VirtualBox

? ? ? ? 默認(rèn)安裝


(二)、安裝Ubuntu14.04.5







然后“繼續(xù)”,“下一步”

信息填完后點(diǎn)擊繼續(xù)安裝完成后會(huì)重新進(jìn)入系統(tǒng)。


(三)、創(chuàng)建用戶hadoop

$ sudo ?adduser ?hadoop

并按照提示輸入hadoop用戶的密碼,例如密碼設(shè)定為 hadoop。注意輸入密碼的時(shí)候是不顯示的。并將hadoop用戶添加進(jìn)sudo用戶組

$ sudo ?usermod ?-G ?sudo ?hadoop

輸入

$ cd ../ ? ??#進(jìn)入到home目錄

$ cd ../ ? ?#進(jìn)入到根目錄

輸入

$ sudo gedit ~/etc/sudoers ? ?#打開(kāi)sudoers配置文件

root ? ? ALL = (ALL:ALL) ? ?ALL下面添加如下代碼:

hadoop????ALL = (ALL:ALL) ? ?ALL

保存并退出。

注銷(xiāo)切換成hadoop用戶



(四)、安裝JDK

? ? ①下載JDK

? ? ? ? ? ? ??jdk-8u151-linux-x64.tar.gz

? ? ②安裝解壓

將下載下來(lái)的 .tar.gz 文件解壓。使用如下命令解壓:

$ sudo ?tar ?zxvf ?./jdk-8u151-linux-x64.tar.gz

為了方便管理,將解壓后的文件移至另一個(gè)目錄下

$ sudo ?mkdir ?/usr/lib/jvm

$ sudo ?mv ?jdk1.8.0_151 ?/usr/lib/jvm

③設(shè)置環(huán)境變量

編輯用戶主目錄下的.bashrc文件

$ vim ?~/.bashrc

在該文件的末尾追加以下幾行代碼:

export ?JAVA_HOME=/usr/lib/jvm/jdk1.8.0_151

export ?CLASSPATH=${JAVA_HOME}/lib

export ?PATH=${JAVA_HOME}/bin:$PATH

為了讓更改立即生效,執(zhí)行如下命令:

$ source ?~/.bashrc

④驗(yàn)證JDK

$ java ?-version


(五)、安裝Hadoop2.7.3

①下載hadoop2.7.3

hadoop-2.7.3.tar.gz

②安裝hadoop-2.7.3

進(jìn)入到下載目錄

將下載下來(lái)的 .tar.gz 文件解壓。使用如下命令解壓:

$ sudo ?tar ?zxvf ?hadoop-2.7.3.tar.gz

為了方便管理,將解壓后的文件移至另一個(gè)目錄下

$ sudo? mv? hadoop-2.7.3? /usr/local/hadoop

為安裝目錄添加權(quán)限

$ sudo ?chmod ?777 ?/usr/local/hadoop

③配置hadoop2.7.3

編輯用戶主目錄下的.bashrc文件

$ gedit? ~/.bashrc

$ vim ?~/.bashrc

在該文件的末尾追加以下幾行代碼:

#HADOOP START

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_151

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP END

保存退出后,激活新加的環(huán)境變量

$ source ? ~/.bashrc

④驗(yàn)證安裝是否成功

$ cd ?/usr/local/hadoop

$ mkdir ?./input

$ cp ./etc/hadoop/*.xml ./input ? ?#將配置文件作為輸入文件

$ ? ./bin/hadoop ?jar ?./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ?./input ?./output ?'dfs[a-z.]+'

$ cat ?./output/* ? ?#查看運(yùn)行結(jié)果

出現(xiàn)以下結(jié)果即可。

(六)、安裝SSH、配置SSH無(wú)密碼登陸

$ sudo apt-get install openssh-server

$ ssh localhost

輸入yes

$ exit ? ? ? ?#退出剛才的 ssh localhost

$ cd ~/.ssh/ ? ? ? ?#若沒(méi)有該目錄,請(qǐng)先執(zhí)行一次ssh localhost

$ ssh-keygen -t rsa ? ? ? #會(huì)有提示,都按回車(chē)就可以

$ cat ./id_rsa.pub >> ./authorized_keys ? ?#加入授權(quán)

然后輸入

$ ssh localhost

結(jié)果如下:



(七)、安裝hadoop-偽分布式配置

Hadoop 可以在單節(jié)點(diǎn)上以偽分布式的方式運(yùn)行,Hadoop 進(jìn)程以分離的 Java 進(jìn)程來(lái)運(yùn)行,節(jié)點(diǎn)既作為 NameNode 也作為 DataNode,同時(shí),讀取的是 HDFS 中的文件。

①修改配置文件

Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中,偽分布式需要修改2個(gè)配置文件 core-site.xml hdfs-site.xml 。Hadoop的配置文件是 xml 格式,每個(gè)配置以聲明 property 的 name 和 value 的方式來(lái)實(shí)現(xiàn)。

修改配置文件 core-site.xml (通過(guò) gedit 編輯會(huì)比較方便: gedit ./etc/hadoop/core-site.xml),將當(dāng)中的

<configuration>

</configuration>

修改為如下配置:

<configuration>

<property>


<name>hadoop.tmp.dir</name>

< value> file:/usr/local/hadoop/tmp< /value>

< description> Abase for other temporary directories.< /description>

</property>

< property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</ property>

</ configuration>

同樣的,修改配置文件 hdfs-site.xml

<configuration>

? ??<property>

? ??????<name>dfs.replication</name>

? ?????? ? ?????<value>1</value>

? ?????? </property>

? ?????? <property>

? ?????? ? ?????? <name>dfs.namenode.name.dir</name>

? ?????? ? ? ?<value>file:/usr/local/hadoop/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/data</value>

</property>

</configuration>

執(zhí)行 NameNode 的格式化:

./bin/hdfs ?namenode ?–format

成功的話,會(huì)看到 “successfully formatted” “Exitting with status 0” 的提示,若為 “Exitting with status 1” 則是出錯(cuò)。

③開(kāi)啟 NameNode 和 DataNode 守護(hù)進(jìn)程。

./sbin/start-dfs.sh

關(guān)閉守護(hù)進(jìn)程

./sbin/stop-dfs.sh

若出現(xiàn)以下SSH提示,輸入yes即可。


④通過(guò)jps查看啟動(dòng)的Hadoop進(jìn)程


⑤運(yùn)行Hadoop偽分布式實(shí)例

./bin/hdfs ?dfs ?-mkdir -p ?/usr/hadoop

./bin/hdfs ?dfs ?-mkdir ?input

./bin/hdfs ?dfs ?-put ?./etc/hadoop/* ?.xml ?input

./bin/hdfs ?dfs ?-ls ?input

./bin/hadoop ?jar ?./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar ?grep ?./input ?./output ?'dfs[a-z.]+'

./bin/hdfs ?dfs ?-cat ?output/*


⑥成功啟動(dòng)后,可以訪問(wèn) Web 界面

http://localhost:50070 查看 NameNodeDatanode 信息,還可以在線查看 HDFS 中的文件。



(八)、啟動(dòng)YARN

①首先修改配置文件 mapred-site.xml,這邊需要先進(jìn)行重命名:

②編輯mapred-site.xml?文件,

gedit ?./etc/hadoop/mapred-site.xml

<configuration>

? ??<property>

? ??????<name>yarn.nodemanager.aux-services</name>

? ??????<value>yarn</value>

? ??</property>

</configuration>

修改配置文件 yarn-site.xml

<configuration>

? ? <property>

? ?????<name>yarn.nodemanager.aux-services</name>

? ?????<value>mapreduce shuffle</value>

? ??</property>

</configuration>

④啟動(dòng) YARN 了(需要先執(zhí)行過(guò) ./sbin/start-dfs.sh)

./sbin/start-dfs.sh? ? #啟動(dòng)YARN

./sbin/mr-jobhistory-daemon.sh ?start ?historyserver? ? #開(kāi)啟歷史服務(wù)器,才能在Web中查看任務(wù)運(yùn)行情況

關(guān)閉YARN

./sbin/stop-yarn.sh

啟動(dòng) YARN 有個(gè)好處是可以通過(guò) Web 界面查看任務(wù)的運(yùn)行情況:http://localhost:8088/cluster,如下圖所示


不啟動(dòng) YARN 需重命名 mapred-site.xml

如果不想啟動(dòng) YARN,務(wù)必把配置文件 mapred-site.xml 重命名,改成 mapred-site.xml.template,需要用時(shí)改回來(lái)就行。

否則在該配置文件存在,而未開(kāi)啟 YARN 的情況下,運(yùn)行程序會(huì)提示 “Retrying connect to server: 0.0.0.0/0.0.0.0:8032” 的錯(cuò)誤,這也是為何該配置文件初始文件名為 mapred-site.xml.template。

⑤開(kāi)啟 NameNode 和 DataNode 守護(hù)進(jìn)程。

./sbin/start-dfs.sh

到此hadoop大數(shù)據(jù)已配置完成。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容