2021-03-29 HBase篇

1:hadoop體系架構(gòu)中,hbase與其他組成部分的相互關(guān)系。
答:hbase利用hadoop mapreduce來處理hbase中的海量數(shù)據(jù),實(shí)現(xiàn)高性能計(jì)算;
利用zookeeper作為協(xié)同服務(wù),實(shí)現(xiàn)穩(wěn)定服務(wù)和失敗恢復(fù);
使用hdfs作為高可靠的底層存儲(chǔ),利用廉價(jià)集群提供海量數(shù)據(jù)存儲(chǔ)能力;
sqoop為hbase提供了高效、便捷的關(guān)系數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入功能;
pig和hive為hbase提供了高層語言支持。
2:請(qǐng)闡述hbase和傳統(tǒng)關(guān)系數(shù)據(jù)庫的區(qū)別。
答: 關(guān)系 hbase
數(shù)據(jù)類型:關(guān)系模型 數(shù)據(jù)模型
存儲(chǔ)模式:基于行模式 基于列模式
數(shù)據(jù)索引:復(fù)雜的索引 唯一行鍵索引
數(shù)據(jù)維護(hù):更新覆蓋 更新新版本不覆蓋
可伸縮性:橫向不易和縱向有限 極其容易
數(shù)據(jù)操作:豐富的操作(表之間)基礎(chǔ)操作(無表之間)
hbase不支持事務(wù)
3:分別解釋hbase中行鍵、列鍵和時(shí)間戳的概念。
答:時(shí)間戳:默認(rèn)系統(tǒng)設(shè)置;也可手動(dòng)用戶自行設(shè)定;區(qū)分應(yīng)用和數(shù)據(jù)的不同版本
行鍵:唯一標(biāo)識(shí)某一行的字節(jié)數(shù)組
列鍵:唯一標(biāo)識(shí)某一列的字節(jié)數(shù)組
4:試述hbase各功能組件及其作用。
(1)庫函數(shù):鏈接到每個(gè)客戶端;
(2)Master主服務(wù)器:主要負(fù)責(zé)表和Region的管理工作
(3)Region服務(wù)器:負(fù)責(zé)存儲(chǔ)和維護(hù)分配給自己的Region,處理來自客戶端的讀寫請(qǐng)求。
12:請(qǐng)闡述HBase的三層結(jié)構(gòu)下,客戶端是如何訪問到數(shù)據(jù)的。
答:首先訪問Zookeeper,獲取-ROOT表的位置信息,然后訪問-Root-表,獲得.MATA.表的信息,接著訪問.MATA.表,找到所需的Region具體位于哪個(gè)Region服務(wù)器,最后才會(huì)到該Region服務(wù)器讀取數(shù)據(jù)。
17:在HBase中,每個(gè)Region服務(wù)器維護(hù)一個(gè)HLog,而不是為每個(gè)Region都單獨(dú)維護(hù)一個(gè)HLog。請(qǐng)說明這種做法的優(yōu)缺點(diǎn)。
答:優(yōu)點(diǎn): 多個(gè)Region對(duì)象的更新操作所發(fā)生的日志修改,只需要不斷把日志記錄追加到單個(gè)日志文件中,不需要同時(shí)打開、寫入到多個(gè)日志文件中。

缺點(diǎn):如果一個(gè)Region服務(wù)器發(fā)生故障,為了恢復(fù)其上次的Region對(duì)象,需要將Region服務(wù)器上的對(duì)象,需要將Region服務(wù)器上的HLog按照其所屬的Region對(duì)象進(jìn)行拆分,然后分發(fā)到其他Region服務(wù)器上執(zhí)行恢復(fù)操作。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容