HBase跨集群遷移調(diào)研方案

HBase跨集群遷移調(diào)研方案回顧

遷移目的

HBase跨集群平滑遷移

方案

方案一

雙寫:replication

歷史數(shù)據(jù):Snapshot——>exportSnapshot——>clone_snapshot——>copyTable

方案二

雙寫:replication

歷史數(shù)據(jù):Snapshot——>exportSnapshot——>bulkload

操作命令

snapshot

#制作snapshot
hbase> snapshot 'myTable', 'myTableSnapshot-122112'
#顯示所有snapshot
hbase> list_snapshots
#發(fā)送snapshot到其他集群
$ bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot MySnapshot -copy-to hdfs://srv2:8082/hbase -mappers 16 -bandwidth 200
#在目標(biāo)集群clone snapshot
hbase> clone_snapshot 'myTableSnapshot-122112', 'myNewTestTable'
#在目標(biāo)機(jī)還原snapshot
hbase> disable 'myTable'
hbase> restore_snapshot 'myTableSnapshot-122112'
hbase> enable 'myTable'
#目標(biāo)集群copy table
$ bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable --starttime=1265875194289 --endtime=1265878794289 --peer.adr=server1,server2,server3:2181:/hbase --families=myOldCf:myNewCf,cf2,cf3 TestTable
#目標(biāo)機(jī)器執(zhí)行bulkload snapshot
bin/hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles <hdfs://storefileoutput> <tablename>

replication

#Add a new replication peer which serial flag is true
hbase> add_peer '1', CLUSTER_KEY => "server1.cie.com:2181:/hbase", SERIAL => true
#Set a replication peer’s serial flag to true(數(shù)據(jù)順序)
hbase> set_peer_serial '1', true
#驗(yàn)證replication數(shù)據(jù)
$ HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath` "${HADOOP_HOME}/bin/hadoop" jar "${HBASE_HOME}/hbase-mapreduce-VERSION.jar" verifyrep --starttime=<timestamp> --endtime=<timestamp> --families=<myFam> <ID> <tableName>

優(yōu)缺點(diǎn)

方案一:開啟replication,snapshot需要先clone到新表,然后再copyTable到舊表

缺點(diǎn):restore_snapshot會(huì)覆蓋replication新數(shù)據(jù);通過MR執(zhí)行,速度慢,不如bulkload執(zhí)行效率高
優(yōu)點(diǎn):表級(jí)操作
方案二:開啟replication,snapshot通過bulkload到數(shù)據(jù)表,不會(huì)覆蓋新數(shù)據(jù)

優(yōu)點(diǎn):導(dǎo)入數(shù)據(jù)數(shù)據(jù)速度非常快;在新版本中已經(jīng)支持整表bulkload方案(CDH-6.0及以上,hBase2.0)
缺點(diǎn):舊版本不支持整表bulkload方案,需要代碼添加功能;再整表bulkload時(shí)默認(rèn)最大HFILE個(gè)數(shù)32,需要根據(jù)需要調(diào)整修改。參數(shù):
hbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily

最終方案

目標(biāo)

采用方案:方案二:

通過bulkload整表導(dǎo)入從集群導(dǎo)入的snapshot快照,完成數(shù)據(jù)遷移;

目標(biāo):平滑遷移,雙寫基礎(chǔ)上,盡可能簡(jiǎn)潔操作,流程短,效率高;

CDH如何支持整表bulkload操作

參考:http://www.itdecent.cn/p/612a8f4ad275

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本周六晚上八點(diǎn),在dbaplus進(jìn)行了一場(chǎng)關(guān)于HBase跨機(jī)房遷移的分享,通過這次分享,給大家系統(tǒng)地介紹了10+p...
    飛鴻無痕閱讀 3,295評(píng)論 4 8
  • 隨著最后一臺(tái)設(shè)備的退還,標(biāo)志著整個(gè)10P+的HBase數(shù)據(jù)遷移完成。目前新集群已經(jīng)在新機(jī)房平穩(wěn)運(yùn)行2個(gè)月,從監(jiān)控圖...
    飛鴻無痕閱讀 2,991評(píng)論 17 14
  • 一、背景 現(xiàn)kylin作為數(shù)據(jù)源提供報(bào)表支撐的場(chǎng)景持續(xù)增多,經(jīng)常出現(xiàn)查詢慢的問題,為提高h(yuǎn)base支撐的穩(wěn)定性,同...
    爛泥_119c閱讀 644評(píng)論 0 0
  • 版權(quán)聲明:本文為博主原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。http://www.itdecent.cn/p/6be82...
    Moon_魔寬閱讀 1,835評(píng)論 0 5
  • 經(jīng)常聽人說“不做作業(yè)母慈子孝,一做作業(yè)雞飛狗跳”,一直覺得形容得有些夸張,不以為然。直到自己親自輔導(dǎo)孩子作業(yè),那場(chǎng)...
    翰默生香閱讀 405評(píng)論 0 3

友情鏈接更多精彩內(nèi)容