集群常見錯誤解決方案

1、java.net.NoRouteToHostException: No route to host?

解決方法:zookeeper的IP要配對?

2、Failed to locate the winutils binary in the hadoop binary path?

解決方法:先安裝好hadoop?

3、CALL TO LOCALHOST/127.0.0.1:9000?

解決方法:host配置正確,/etc/sysconfig/network??? /etc/hosts??? /etc/sysconfig/network-scripts/ifcfg-eth0?

4、打開namenode:50070頁面,Datanode Infomation只顯示一個節(jié)點(diǎn)?

解決方法:SSH配置錯誤導(dǎo)致,主機(jī)名一定要嚴(yán)格匹配,重新配置ssh免密碼登錄?

5、建議:不要隨意格式化HDFS,這會帶來數(shù)據(jù)版本不一致等諸多問題,格式化前要清空數(shù)據(jù)文件夾?

6、namenode1: ssh: connect to host namenode1 port 22: Connection refused?

解決方法:sshd被關(guān)閉或沒安裝導(dǎo)致,which sshd檢查是否安裝,若已經(jīng)安裝,則sshd restart,并ssh 本機(jī)hostname,檢查是否連接成功?

7、Log aggregation has not completed or is not enabled.?

解決方法:在yarn-site.xml中增加相應(yīng)配置,以支持日志聚合?

8、Exception in thread "main" org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application master.?

解決方法:yarn-lient模式出現(xiàn)的異常,暫時無解?

9、hadoop的文件不能下載以及YARN中Tracking UI不能訪問歷史日志?

解決方法:windows系統(tǒng)不能解析域名所致,把hosts文件hostname復(fù)制到windows的hosts中?

10、建議:HDFS文件路徑寫法為:hdfs://master:9000/文件路徑,這里的master是namenode的hostname,9000是hdfs端口號。?

11、Yarn JobHistory Error: Failed redirect for container?

解決方法:將 http://:19888/jobhistory/logs? 配置到y(tǒng)arn-site.xml中,重啟yarn和JobHistoryServer?

12、通過hadoop UI訪問hdfs文件夾時,出現(xiàn)提示 Permission denied: user=dr.who?

解決方法:namonode節(jié)點(diǎn)終端執(zhí)行:hdfs dfs -chmod -R 755 /?

13、建議:提交到y(tǒng)arn cluster的作業(yè)不能直接print到控制臺,要用log4j輸出到日志文件中?

14、log4j:WARN Unsupported encoding?

解決方法:1.把UTF改成小寫utf-8??? 2.設(shè)置編碼那行有空格?

15、 ERROR ApplicationMaster: SparkContext did not initialize after waiting for 100000 ms. Please check earlier log output for errors. Failing the application

解決方法:資源不能分配過大,或者沒有把.setMaster("local")去掉

16、Yarn的RM單點(diǎn)故障?

解決方法:通過三節(jié)點(diǎn)zookeeper集群和yarn-site.xml配置文件完成Yarn HA?

17、Yarn HA環(huán)境下,通過web訪問history日志被跳轉(zhuǎn)到8088而無法顯示?

解決方法:恢復(fù)Yarn Http默認(rèn)端口8088?

18、Using config: /work/poa/zookeeper-3.4.6/bin/../conf/zoo.cfg? Error contacting service. It is probably not running.?

解決方法:配置文件不正確,例如hostname不匹配等?

19、linux服務(wù)器磁盤爆滿,檢查超過指定大小的文件?

解決方法:find / -type f -size +10G??

20、HADOOP 磁盤滿的各節(jié)點(diǎn)平衡?

解決方法:運(yùn)行指令hdfs balancer -Threshold 3 或者 運(yùn)行 start-balancer.sh 腳本格式:$Hadoop_home/bin/start-balancer.sh -threshold,參數(shù)3是比例參數(shù),表示3%,也就是平各個DataNode直接磁盤使用率偏差在3%以內(nèi)?

21、建議:數(shù)據(jù)傾斜只發(fā)生在shuffle過程,可能觸發(fā)shuffle操作的算子有:distinct? groupByKey? reduceByKey? aggregateByKey? join? cogroup? repartition等?

22、啟動hadoop yarn,發(fā)現(xiàn)只啟動了ResourceManager,沒有啟動NodeManager?

解決方法:yarn-site.xml配置有問題,檢查并規(guī)范各項(xiàng)配置?

23、如何查看hadoop系統(tǒng)日志?

解決方法:Hadoop 2.x中YARN系統(tǒng)的服務(wù)日志包括ResourceManager日志和各個NodeManager日志,它們的日志位置如下:ResourceManager日志存放位置是Hadoop安裝目錄下的logs目錄下的yarn-*-resourcemanager-*.log,NodeManager日志存放位置是各個NodeManager節(jié)點(diǎn)上hadoop安裝目錄下的logs目錄下的yarn-*-nodemanager-*.log?

24、建議:小于128M的小文件都會占據(jù)一個128M的BLOCK,合并或者刪除小文件節(jié)省磁盤空間?

25、how to remove Non DFS Used?

解決方法:1)清除hadoop數(shù)據(jù)目錄中用戶緩存文件:cd /data/hadoop/storage/tmp/nm-local-dir/usercache;du -h;rm -rf `find? -type f -size +10M`;? 2)清理Linux文件系統(tǒng)中的垃圾數(shù)據(jù)?

26、linux profile配置文件隔離?

解決方法:cd /etc/profile.d;在這里新建相應(yīng)配置腳本?

27、啟動yarn,發(fā)現(xiàn)只啟動了部分Nodemanager?

解決方法:未啟動的節(jié)點(diǎn)缺少yarn相關(guān)包,要保持所有節(jié)點(diǎn)jar包一致?

28、HDFS誤刪文件如何恢復(fù)解決方法:core-site文件中加入?

???? fs.trash.interval?

???? 2880?

???? HDFS垃圾箱設(shè)置,可以恢復(fù)誤刪除,配置的值為分鐘數(shù),0為禁用?

恢復(fù)文件執(zhí)行 hdfs dfs -mv? /user/root/.Trash/Current/誤刪文件??? /原路徑?

29、改了linux定時腳本里邊部分任務(wù)順序,導(dǎo)致有些任務(wù)未執(zhí)行,而有些重復(fù)執(zhí)行?

解決方法:Linux腳本修改后實(shí)時生效,務(wù)必在腳本全部執(zhí)行完再修改,以免產(chǎn)生副作用?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 一、系統(tǒng)參數(shù)配置優(yōu)化 1、系統(tǒng)內(nèi)核參數(shù)優(yōu)化配置 修改文件/etc/sysctl.conf,添加如下配置,然后執(zhí)行s...
    張偉科閱讀 3,927評論 0 14
  • 終極算法 關(guān)注微信號每天收聽我們的消息終極算法為您推送精品閱讀 前言 Hadoop 在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)...
    Yespon閱讀 131,149評論 12 168
  • 前言 Hadoop在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)重要,Hadoop是大數(shù)據(jù)技術(shù)的基礎(chǔ),對Hadoop基礎(chǔ)知識的掌握的...
    __豆約翰__閱讀 1,653評論 2 3
  • 前言 Hadoop在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)重要,Hadoop是大數(shù)據(jù)技術(shù)的基礎(chǔ),對Hadoop基礎(chǔ)知識的掌握的...
    piziyang12138閱讀 2,000評論 0 3
  • 文/恰恰天藍(lán) 1 直到上星期,我算是跟用了十幾年的Windows XP(以下簡稱XP)說「再見」了。 如果不是藍(lán)屏...
    恰恰天藍(lán)閱讀 345評論 0 0

友情鏈接更多精彩內(nèi)容