HDFS(6)- distcp并行復(fù)制

我們可以用Java Api寫代碼進(jìn)行復(fù)制文件或目錄,也可以使用hadoop fs -cp進(jìn)行復(fù)制,可這兩種效率并不高,拷貝文件或目錄寫代碼也麻煩。使用distcp并行處理是比較好的手段。

命令

復(fù)制文件

  hadoop distcp file1 file2

復(fù)制目錄

  hadoop distcp dir1 dir2

如果dir2不存在,將新建dir2,目錄dir1的內(nèi)容全部復(fù)制到dir2下??梢灾付ǘ鄠€(gè)源路徑,所有源路徑下的內(nèi)容都將被復(fù)制到目標(biāo)路徑下。

如果dir2已經(jīng)存在,那么目錄dir1將被復(fù)制到dir2下,形成目錄結(jié)構(gòu)dir2/dir1。也可以添加-overwrite選項(xiàng),在保持目錄結(jié)構(gòu)的同時(shí)強(qiáng)制覆蓋原文件。

  hadoop distcp -overwrite dir1 dir2

也可以使用-update選項(xiàng),僅更新發(fā)生變化的文件。

  hadoop distcp -update dir1 dir2

在HDFS集群間傳遞數(shù)據(jù)

  hadoop distcp -update -delete -p hdfs://namenode1/foo hdfs://namenode2/foo

以上命令在第二個(gè)集群上為第一個(gè)集群的/foo目錄創(chuàng)建一個(gè)備份。
-delete選項(xiàng)允許刪除目標(biāo)路徑中任意沒在源路徑中出現(xiàn)的文件或目錄。
-p選項(xiàng)設(shè)置文件的狀態(tài)屬性被保留,如權(quán)限、塊大小和副本數(shù)。

如果兩個(gè)集群運(yùn)行的HDFS版本不兼容,可以使用webhdfs進(jìn)行distcp:

  hadoop distcp webhdfs://namenode1:50070/foo webhdfs://namenode2:50070/foo

原理

distcp是作為一個(gè)MapReduce作業(yè)來實(shí)現(xiàn)的,通過在集群中并行運(yùn)行的map來完成,這里沒有reduce階段。默認(rèn)情況下,會(huì)啟動(dòng)20個(gè)map任務(wù),但是可以通過distcp指定-m參數(shù)來修改map數(shù)目。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 目的這篇教程從用戶的角度出發(fā),全面地介紹了Hadoop Map/Reduce框架的各個(gè)方面。先決條件請(qǐng)先確認(rèn)Had...
    SeanC52111閱讀 1,837評(píng)論 0 1
  • 數(shù)據(jù)流 讀取文件數(shù)據(jù)的剖析 客戶端通過調(diào)用FileSystem對(duì)象的open()方法打開一個(gè)希望從中讀取數(shù)據(jù)的文件...
    單行線的旋律閱讀 338評(píng)論 0 2
  • 當(dāng)數(shù)據(jù)量增大到超出了單個(gè)物理計(jì)算機(jī)存儲(chǔ)容量時(shí),有必要把它分開存儲(chǔ)在多個(gè)不同的計(jì)算機(jī)中。那些管理存儲(chǔ)在多個(gè)網(wǎng)絡(luò)互連的...
    單行線的旋律閱讀 2,074評(píng)論 0 7
  • MapReduce是一個(gè)數(shù)據(jù)處理的編程模型。這個(gè)模型很簡(jiǎn)單,但也不是簡(jiǎn)單到不能夠支持一些有用的語言。Hadoop能...
    單行線的旋律閱讀 1,602評(píng)論 0 2
  • 很多人都知道麗江是旅游勝地,山美水美人更美。而且麗江還是個(gè)生產(chǎn)藥材的基地,估計(jì)這和當(dāng)?shù)氐奶鞖庥嘘P(guān)。90后的妹子小...
    在水一方321閱讀 406評(píng)論 0 0

友情鏈接更多精彩內(nèi)容