色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<option id="vx5p1"><tbody id="vx5p1"></tbody></option>

登錄注冊寫文章

【Hadoop】HDFS的運行原理

【Hadoop】HDFS的運行原理

簡介
HDFS（Hadoop Distributed File System ）Hadoop分布式文件系統(tǒng)。是根據(jù)google發(fā)表的論文翻版的。論文為GFS（Google File System）Google 文件系統(tǒng)（中文，英文）。
HDFS有很多特點：
**① **保存多個副本，且提供容錯機制，副本丟失或宕機自動恢復。默認存3份。
**② **運行在廉價的機器上。
**③ **適合大數(shù)據(jù)的處理。多大？多?。縃DFS默認會將文件分割成block，64M為1個block。然后將block按鍵值對存儲在HDFS上，并將鍵值對的映射存到內(nèi)存中。如果小文件太多，那內(nèi)存的負擔會很重。

如上圖所示，HDFS也是按照Master和Slave的結(jié)構(gòu)。分NameNode、SecondaryNameNode、DataNode這幾個角色。
NameNode：是Master節(jié)點，是大領(lǐng)導。管理數(shù)據(jù)塊映射；處理客戶端的讀寫請求；配置副本策略；管理HDFS的名稱空間；
SecondaryNameNode：是一個小弟，分擔大哥namenode的工作量；是NameNode的冷備份；合并fsimage和fsedits然后再發(fā)給namenode。
DataNode：Slave節(jié)點，奴隸，干活的。負責存儲client發(fā)來的數(shù)據(jù)塊block；執(zhí)行數(shù)據(jù)塊的讀寫操作。
熱備份：b是a的熱備份，如果a壞掉。那么b馬上運行代替a的工作。
冷備份：b是a的冷備份，如果a壞掉。那么b不能馬上代替a工作。但是b上存儲a的一些信息，減少a壞掉之后的損失。
fsimage:元數(shù)據(jù)鏡像文件（文件系統(tǒng)的目錄樹。）
edits：元數(shù)據(jù)的操作日志（針對文件系統(tǒng)做的修改操作記錄）
namenode內(nèi)存中存儲的是=fsimage+edits。
SecondaryNameNode負責定時默認1小時，從namenode上，獲取fsimage和edits來進行合并，然后再發(fā)送給namenode。減少namenode的工作量。

工作原理
寫操作：

有一個文件FileA，100M大小。Client將FileA寫入到HDFS上。
HDFS按默認配置。
HDFS分布在三個機架上Rack1，Rack2，Rack3。

a. Client將FileA按64M分塊。分成兩塊，block1和Block2;
b. Client向nameNode發(fā)送寫數(shù)據(jù)請求，如圖藍色虛線①------>。
c. NameNode節(jié)點，記錄block信息。并返回可用的DataNode，如粉色虛線②--------->。
Block1: host2,host1,host3
Block2: host7,host8,host4
原理：
NameNode具有RackAware機架感知功能，這個可以配置。
若client為DataNode節(jié)點，那存儲block時，規(guī)則為：副本1，同client的節(jié)點上；副本2，不同機架節(jié)點上；副本3，同第二個副本機架的另一個節(jié)點上；其他副本隨機挑選。
若client不為DataNode節(jié)點，那存儲block時，規(guī)則為：副本1，隨機選擇一個節(jié)點上；副本2，不同副本1，機架上；副本3，同副本2相同的另一個節(jié)點上；其他副本隨機挑選。
d. client向DataNode發(fā)送block1；發(fā)送過程是以流式寫入。
流式寫入過程，
** 1>**將64M的block1按64k的package劃分;
2>然后將第一個package發(fā)送給host2;
3>host2接收完后，將第一個package發(fā)送給host1，同時client想host2發(fā)送第二個package；
4>host1接收完第一個package后，發(fā)送給host3，同時接收host2發(fā)來的第二個package。
5>以此類推，如圖紅線實線所示，直到將block1發(fā)送完畢。
6>host2,host1,host3向NameNode，host2向Client發(fā)送通知，說“消息發(fā)送完了”。如圖粉紅顏色實線所示。
7>client收到host2發(fā)來的消息后，向namenode發(fā)送消息，說我寫完了。這樣就真完成了。如圖黃色粗實線
8>發(fā)送完block1后，再向host7，host8，host4發(fā)送block2，如圖藍色實線所示。
9>發(fā)送完block2后，host7,host8,host4向NameNode，host7向Client發(fā)送通知，如圖淺綠色實線所示。
10>client向NameNode發(fā)送消息，說我寫完了，如圖黃色粗實線。。。這樣就完畢了。
分析，通過寫過程，我們可以了解到：
①寫1T文件，我們需要3T的存儲，3T的網(wǎng)絡流量貸款。
②在執(zhí)行讀或?qū)懙倪^程中，NameNode和DataNode通過HeartBeat進行保存通信，確定DataNode活著。如果發(fā)現(xiàn)DataNode死掉了，就將死掉的DataNode上的數(shù)據(jù)，放到其他節(jié)點去。讀取時，要讀其他節(jié)點去。
③掛掉一個節(jié)點，沒關(guān)系，還有其他節(jié)點可以備份；甚至，掛掉某一個機架，也沒關(guān)系；其他機架上，也有備份。

讀操作：

讀操作就簡單一些了，如圖所示，client要從datanode上，讀取FileA。而FileA由block1和block2組成。

那么，讀操作流程為：
a. client向namenode發(fā)送讀請求。
b. namenode查看Metadata信息，返回fileA的block的位置。
block1:host2,host1,host3
block2:host7,host8,host4
c. block的位置是有先后順序的，先讀block1，再讀block2。而且block1去host2上讀??；然后block2，去host7上讀取；

上面例子中，client位于機架外，那么如果client位于機架內(nèi)某個DataNode上，例如,client是host6。那么讀取的時候，遵循的規(guī)律是：
優(yōu)選讀取本機架上的數(shù)據(jù)。

HDFS中常用到的命令
1、hadoop fs
+ View Code

2、hadoop fsadmin
+ View Code

3、hadoop fsck
4、start-balancer.sh

最后編輯于：2017.11.27 02:41:44

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

hadoop-HDFS運行原理
簡介：HDFS（Hadoop Distributed File System ）Hadoop分布式文件系統(tǒng)。是根據(jù)...
先生_呂閱讀 672評論 0贊 2
HDFS 工作原理
HDFS 工作原理 HDFS 架構(gòu) 如上圖所示，HDFS也是按照Master和Slave的結(jié)構(gòu)。分NameNode...
heamon7閱讀 910評論 0贊 1

hadoop HDFS原理解析
hadoop HDFS原理解析01 HDFS架構(gòu)?NameNode?DataNode?Sencondary Nam...
白菜青蘿卜閱讀 2,853評論 2贊 30
請和我開始一場勢均力敵的婚姻
最近在籌備人生第一次婚禮（也是唯一一次，希望不要被焦先生打）我和焦先生相識于惡俗的朋友介紹（通俗一點就是相親）。...
東兒大人閱讀 189評論 0贊 0
我們用，噴泉池，煮個火鍋怎么樣
路過噴泉的時候在和達浪討論，想把它做成一個火鍋，關(guān)了水在中間插上隔板，一邊是紅湯一邊是白湯，然后去1987里每家餐...
奇思妙起司貓閱讀 158評論 0贊 0

友情鏈接更多精彩內(nèi)容

2贊3贊

贊賞

手機看全文

福贡县| 沙湾县| 贞丰县| 仙桃市| 阳新县| 丘北县| 上饶市| 尼勒克县| 黎平县| 营山县| 临西县| 高要市| 新邵县| 渝北区| 东兰县| 万安县| 蒙山县| 沾化县| 盘锦市| 桐梓县| 招远市| 濮阳县| 延吉市| 专栏| 营口市| 蒲江县| 铁力市| 靖西县| 肥城市| 永平县| 左权县| 滕州市| 铜陵市| 天台县| 余姚市| 丰都县| 博湖县| 逊克县| 华阴市| 左贡县| 昌黎县|