中文字幕色一二,久久爆乳一区二区

介紹

Hadoop分布式文件系統(tǒng)（HDFS）是一種運行在通用硬件上的分布式文件系統(tǒng)。它與傳統(tǒng)的分布式文件系統(tǒng)有很多相似之處，但是也有顯著的不同。HDFS是高容錯的，可以部署在低成本硬件上。HDFS提供了對應用數(shù)據(jù)的高吞吐量訪問，適用于具有大數(shù)據(jù)集的應用。HDFS為了流數(shù)據(jù)訪問放松了一些POSIX的限制。

設定和目標

硬件故障：硬件故障是常態(tài)。一個HDFS實例可能由成百上千個服務器組成，每臺服務器存儲部分數(shù)據(jù)。如此大量的組件，每個組件都有發(fā)生故障的概率，這意味著總有組件是不工作的。因此，故障探測，快速，自動回復一直是HDFS的核心架構目標。
流數(shù)據(jù)訪問：某些運行在HDFS上的應用程序需要以流的方式訪問數(shù)據(jù)集。為此，HDFS在批處理上做了更多設計。重點在于數(shù)據(jù)訪問的高吞吐量而不是數(shù)據(jù)訪問的低延遲。
大數(shù)據(jù)集：典型的HDFS文件通常以GB乃至TB計。
簡單的一致性模型：HDFS文件使用的是一次寫入，多次讀取的訪問模型。文件一旦創(chuàng)建完畢，除了append和truncate，文件不需要寫入和關閉。文件可以追加但是無法更新。這個設定簡化了數(shù)據(jù)一致性問題從而帶來了高吞吐量的數(shù)據(jù)訪問。
移動計算比移動數(shù)據(jù)更廉價：數(shù)據(jù)與計算過程在同一節(jié)點上無疑可以讓計算效率更高，尤其是在面對海量數(shù)據(jù)的時候。這么做可以極大的減少網(wǎng)絡堵塞并提高系統(tǒng)吞吐量。HDFS假定將計算過程移動到數(shù)據(jù)處比將數(shù)據(jù)移動到計算過程處更好。
跨異構硬件和軟件平臺的可移植性：HDFS可以很容易的從一個平臺移植到另一個平臺。

NameNode和DataNode

HDFS是主從結構。一個HDFS集群由一個NameNode和一組DataNode組成。NameNode是主服務器，負責管理文件系統(tǒng)命名空間以及客戶端對文件的訪問。DataNode通常每個節(jié)點一個，負責管理存儲。HDFS對外暴露了一個文件系統(tǒng)命名空間并允許用戶數(shù)據(jù)作為文件存儲。在內(nèi)部實現(xiàn)上，一個文件會被分割成一個或多個block，這些block存儲在一組DataNode上。NameNode負責執(zhí)行文件系統(tǒng)命名空間操作，例如打開，關閉，重命名文件和目錄等。此外NameNode還維護著block和DataNode之間的映射關系。DataNode負責處理來自客戶端的讀寫請求，并根據(jù)NameNode的指令創(chuàng)建，刪除，備份block。

image

NameNode和DataNode都是運行在通用機器上的軟件。這些機器通常使用Linux系統(tǒng)。HDFS使用Java構建，任何支持Java的機器都可以運行NameNode和DataNode。一種典型的集群部署方式是使用一臺機器運行NameNode，其它機器每臺運行一個DataNode實例。

文件系統(tǒng)命名空間

HDFS使用傳統(tǒng)的分層文件結構。用戶可以創(chuàng)建目錄并在目錄下存儲文件。文件系統(tǒng)命名空間結構與傳統(tǒng)文件系統(tǒng)類似，用戶可以創(chuàng)建，刪除文件，將文件從一個目錄移動到另一個目錄，重命名文件。HDFS支持用戶限額和訪問權限。

NameNode維護整個文件系統(tǒng)命名空間，它會記錄任何對命名空間的修改。應用程序可以指定HDFS中文件的備份數(shù)量。文件的拷貝數(shù)稱為該文件的備份因子。這個信息也存儲在NameNode中。

數(shù)據(jù)備份

HDFS可以跨機器存儲海量文件。每個文件分成一個block的序列存儲。為了容錯，文件的block會被備份。每個文件的block大小和備份因子都是可配置的。

文件中所有block的大小是相等的（除了最后一個），而對append和hsync提供可變長block支持后，用戶可以直接創(chuàng)建一個新block，不必繼續(xù)填充最后一個block。

應用程序可以指定文件的備份數(shù)。備份因子可在文件創(chuàng)建時指定，也可以稍后修改。HDFS的文件都是一次寫入的（除了append和truncate），并且任何時候都只有一個寫入器。

NameNode決定如何備份block。它周期性的接收來自DataNode的心跳檢測和block報表。收到心跳檢測說明DataNode工作正常，block報表包含該DataNode上的所有block。

image

副本安置：第一步

備份文件的位置對HDFS的可用性和性能至關重要。對備份的優(yōu)化讓HDFS從眾多分布式系統(tǒng)中脫穎而出。這個工作需要大量的優(yōu)化和經(jīng)驗。機架感知備份放置策略的目的是提高數(shù)據(jù)的可靠性，可用性和網(wǎng)絡帶寬利用率。目前的備份放置策略實現(xiàn)是這個方向上的第一步。短期目標是在生產(chǎn)環(huán)境上對其進行驗證，更多的了解它的行為，為測試和研究更復雜的策略奠定基礎。

大型HDFS集群的機器通常隸屬于多個機架。兩個不同機架上的節(jié)點進行通信必須通過交換機。一般來說，同一機架機器之間的網(wǎng)絡帶寬要優(yōu)于不同機架機器間的網(wǎng)絡帶寬。

NameNode通過Hadoop Rack Awareness進程確定每個DataNode所屬的機架ID。一個簡單但是并非最優(yōu)的策略是將備份放置在獨立的機架上。這種策略可以避免機架故障時丟失數(shù)據(jù)，讀數(shù)據(jù)時也可以利用多個機架的網(wǎng)絡帶寬。這種策略在集群中平均分配備份文件，這樣組件發(fā)生故障時可以平衡負載。但是這種策略會增加寫入成本，因為數(shù)據(jù)需要跨機架傳輸。

最常見的情況，備份因子是3。HDFS的放置策略是：如果寫入器位于DataNode上，則將副本放置在本地計算機，否則隨機選擇一個DataNode，另一個副本放置在另一個遠程機架的節(jié)點上，最后一個副本放在同一個遠程機架的另一個節(jié)點上。這種策略減少了機架間的寫入流量，從而提高寫性能。機架發(fā)生故障的幾率遠小于節(jié)點故障幾率。這種策略并不影響數(shù)據(jù)可靠性和可用性，但是它確實減少了讀操作時的聚合網(wǎng)絡帶寬，因為一個block被放置到兩個機架上而不是三個。這種策略的文件副本并不是均勻的分布在所有機架上，副本的三分之一位于一個節(jié)點，剩下的三分之二位于另一個機架上。這種策略可以提高寫性能，而不會影響數(shù)據(jù)可靠性和讀性能。

如果備份因子大于3，那么第四個和之后的副本隨機放置，同時要保證副本數(shù)量不能超過機架的上限（公式：(replicas - 1) / racks + 2）。

由于DataNode不能放置同一個block的多個副本，所以最大備份因子就是最大DataNode數(shù)。

在提供了存儲類型和存儲策略的支持之后，除了機架感知，NameNode放置副本時也會考慮放置策略。NameNode首先根據(jù)機架感知選擇節(jié)點，然后根據(jù)備份文件的放置策略檢查該節(jié)點的存儲類型，如果該候選節(jié)點沒有要求的存儲類型，NameNode會查找下一個節(jié)點。如果第一輪沒有找到足夠的節(jié)點放置備份，NameNode會使用后備存儲類型開始第二輪查找。

目前，副本放置策略依然在開發(fā)中。

副本選擇

為了減少帶寬消耗和讀延遲，HDFS會嘗試找尋一個離讀請求最近的副本。如果讀請求節(jié)點所在機架有這樣一個副本，HDFS就優(yōu)先使用這個副本。如果HDFS集群跨越多個數(shù)據(jù)中心，則本地數(shù)據(jù)中心的副本優(yōu)先于遠程副本。

安全模式

啟動HDFS時，NameNode會進入一種稱為安全模式的特殊狀態(tài)。安全模式下數(shù)據(jù)block無法備份。NameNode會從DataNode接收心跳檢測和block報表。block報表包含該DataNode下所有數(shù)據(jù)block的列表信息。每個block都有一個指定的最小備份數(shù)。只有block的最小備份數(shù)登記到NameNode中后，block才可以備份。備份登記結束后，NameNode退出安全模式。這是如果還有block不滿足最小備份數(shù)的條件，NameNode才開始備份這些block。

文件系統(tǒng)元數(shù)據(jù)持久化

HDFS命名空間由NameNode保存，NameNode使用一個稱為EditLog的事務日志記錄對文件系統(tǒng)元數(shù)據(jù)的所有更改。例如，創(chuàng)建一個新文件會在EditLog中插入一條對應記錄，同樣的，修改文件備份因子也會插入一條記錄。NameNode使用本地文件存儲EditLog。整個文件系統(tǒng)命名空間，包括文件與block之間的映射關系，文件系統(tǒng)數(shù)據(jù)等，都保存在FsImage文件中。

NameNode在內(nèi)存中維護文件系統(tǒng)命名空間和文件block映射關系的鏡像。當NameNode啟動，或者某個閾值觸發(fā)了檢查點時，NameNode從磁盤上讀取FsImage和EditLog的內(nèi)容，將所有EditLog中的事務操作應用到FsImage的內(nèi)存鏡像中，然后在磁盤上生成一個全新的FsImage。之后可以截斷EditLog，因為所有事務都已持久化到FsImage。這個過程稱為檢查點。檢查點的目的是通過獲取文件系統(tǒng)元數(shù)據(jù)的快照并保存到FsImage來保證HDFS文件系統(tǒng)元數(shù)據(jù)的一致性。讀取FsImage可能很快，但是持續(xù)編輯FsImage就不同了。因此我們將操作記錄到EditLog中，而不是直接修改FsImage。在檢查點期間，所有EditLog操作應用到FsImage。檢查點可以按周期觸發(fā)（dfs.namenode.checkpoint.period），也可以按事務數(shù)觸發(fā)（dfs.namenode.checkpoint.txns）。如果兩個屬性都設置了，第一個滿足的閾值會觸發(fā)檢查點。

DataNode在本地文件系統(tǒng)中存儲HDFS數(shù)據(jù)。DataNode對HDFS文件一無所知，它以block為單位存儲HDFS數(shù)據(jù)。DataNode不會在同一個目錄下保存所有文件。相反，它使用啟發(fā)式方法來確定每個目錄的最佳文件數(shù)，并適時創(chuàng)建子目錄。在同一個目錄下創(chuàng)建所有文件并不是最佳選擇，因為本地文件系統(tǒng)可能無法支持一個目錄下的大量文件。DataNode啟動時，它會掃描整個本地文件系統(tǒng)，生成一個本地文件與數(shù)據(jù)block之間的關系列表，將其發(fā)送給NameNode，這個列表稱為block報告。

通信協(xié)議

所有HDFS通信協(xié)議都構建在TCP/IP協(xié)議之上?？蛻舳送ㄟ^TCP端口與NameNode建立連接，它使用ClientProtocol與NameNode交互。DataNode使用DataProtocol與NameNode交互。一個RPC抽象封裝了客戶端協(xié)議和DataNode協(xié)議。NameNode從不初始化任何RPC，它只是響應來自的客戶端和DataNode的請求。

健壯性

HDFS的主要目標是即使出現(xiàn)故障也可以可靠的存儲數(shù)據(jù)。三種常見的故障分別是：NameNode故障，DataNode故障和網(wǎng)絡分區(qū)。

數(shù)據(jù)磁盤故障，心跳檢測和重備份

DataNode周期性的發(fā)送心跳檢測給NameNode。網(wǎng)絡分區(qū)可能導致某些DataNode無法連接NameNode。NameNode無法收到DataNode的心跳檢測后，它會把這樣的DataNode標記為dead，并不在發(fā)送新的I/O請求。注冊到死亡DataNode上的數(shù)據(jù)對HDFS來說不再可用，也會導致某些block的備份數(shù)少于文件指定的最小備份數(shù)。NameNode持續(xù)追蹤block的備份情況并在必要時初始化備份操作。重備份的原因是多種多樣的：DataNode不可用，某個備份文件損壞，DataNode磁盤故障，或者文件的備份因子增大。

為了避免DataNode狀態(tài)抖動引起的備份風暴，標記DataNode死亡的超時時間設置的很長（默認超過10分鐘）。用戶可以設置一個更短的時間將DataNode標記為陳舊（stale），這樣可以避免對性能敏感的工作負載的陳舊DataNode的讀寫操作。

集群重平衡

HDFS架構與數(shù)據(jù)重平衡scheme兼容。scheme可以在DataNode的磁盤空間低于某個閾值時將數(shù)據(jù)移動到另一個DataNode上。如果對某個文件的需求特別高，scheme還可以動態(tài)創(chuàng)建額外的副本并平衡到整個集群中。這些數(shù)據(jù)平衡scheme還未實現(xiàn)。

數(shù)據(jù)完整性

從DataNode中讀取的block可能是損壞的。損壞的原因有多種：磁盤故障，網(wǎng)絡故障，或者軟件問題。HDFS客戶端會對文件內(nèi)容進行校驗和檢查。當客戶端創(chuàng)建一個HDFS文件時，它會計算出文件所有block的校驗和并保存在同一個命名空間的一個獨立的隱藏文件中。當客戶單檢索文件時還要檢查對應校驗和文件中的值。如果校驗和不匹配，客戶端會嘗試該block其它節(jié)點上的副本。

元數(shù)據(jù)磁盤故障

FsImage和EditLog是HDFS的核心數(shù)據(jù)結構。如果它們發(fā)生損壞，HDFS就無法使用了。因此，可以通過配置讓NameNode維護多個FsImage和EditLog的拷貝。對兩個文件的修改會同步到所有拷貝中。這種同步操作會降低NameNode的TPS，但是這種犧牲是可接受的，因為HDFS是數(shù)據(jù)密集，不是元數(shù)據(jù)密集。NameNode重啟時，它會選擇最一致的FsImage和EditLog使用。

另一種減低故障的辦法是使用HA。

快照

（略）

數(shù)據(jù)組織

數(shù)據(jù)block

HDFS的目的是支持大型文件。HDFS支持一次寫入多次讀取。一個典型的block大小是128MB。因此，HDFS文件按照128MB的大小分割，每個block可能分布在不同的節(jié)點上。

備份管道

客戶端向HDFS文件寫入數(shù)據(jù)時，如果備份因子是三，NameNode使用備份目標選擇算法檢索出一組DataNode。這個列表是可以存儲副本的DataNode?？蛻舳讼认虻谝粋€DataNode寫入數(shù)據(jù)，DataNode接收數(shù)據(jù)并將數(shù)據(jù)傳輸?shù)搅斜碇械牡诙€DataNode。第二個DataNode開始接收數(shù)據(jù)并繼續(xù)傳輸數(shù)據(jù)到第三個DataNode。這樣，數(shù)據(jù)通過管道從一個DataNode傳輸?shù)较乱粋€。

可訪問性

（略）

空間回收

文件刪除和恢復

如果開啟了trash配置，從FS shell中刪除的文件并不會立刻從HDFS中刪除，HDFS將它移動到一個trash目錄（每個用戶都有自己的trash目錄，/user/<username>/.Trash）。只要文件還在trash目錄中就可以快速恢復。

最近刪除的文件移動到/user/<username>/.Trash/Current目錄中，每隔一段時間，HDFS會為這些文件創(chuàng)建檢查點文件（/user/<username>/.Trash/<date>）并刪除舊檢查點文件。

如果trash中的文件過期了，NameNode將這些文件從命名空間中刪除。與文件關聯(lián)的block被釋放。刪除文件和空間釋放之間可能會有延遲。

下面是一個例子，首先創(chuàng)建兩個文件：

$ hadoop fs -mkdir -p delete/test1
$ hadoop fs -mkdir -p delete/test2
$ hadoop fs -ls delete/
Found 2 items
drwxr-xr-x   - hadoop hadoop          0 2015-05-08 12:39 delete/test1
drwxr-xr-x   - hadoop hadoop          0 2015-05-08 12:40 delete/test2

然后刪除test1，該文件會被移到Trash目錄：

$ hadoop fs -rm -r delete/test1
Moved: hdfs://localhost:8020/user/hadoop/delete/test1 to trash at: hdfs://localhost:8020/user/hadoop/.Trash/Current

接著跳過Trash刪除test2：

$ hadoop fs -rm -r -skipTrash delete/test2
Deleted delete/test2

現(xiàn)在可以查看Trash目錄：

$ hadoop fs -ls .Trash/Current/user/hadoop/delete/
Found 1 items\
drwxr-xr-x   - hadoop hadoop          0 2015-05-08 12:39 .Trash/Current/user/hadoop/delete/test1

降低備份因子

文件的備份因子降低后，NameNode選擇可以刪除的副本，在下次心跳檢測時把信息發(fā)送給DataNode，之后DataNode刪除block并釋放空間。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Hadoop文檔（2.9.2） - HDFS架構

Hadoop文檔（2.9.2） - HDFS架構

介紹

設定和目標

NameNode和DataNode

文件系統(tǒng)命名空間

數(shù)據(jù)備份

副本安置：第一步

副本選擇

安全模式

文件系統(tǒng)元數(shù)據(jù)持久化

通信協(xié)議

健壯性

數(shù)據(jù)磁盤故障，心跳檢測和重備份

集群重平衡

數(shù)據(jù)完整性

元數(shù)據(jù)磁盤故障

快照

數(shù)據(jù)組織

數(shù)據(jù)block

備份管道

可訪問性

空間回收

文件刪除和恢復

降低備份因子

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Hadoop文檔（2.9.2） - HDFS架構

介紹

設定和目標

NameNode和DataNode

文件系統(tǒng)命名空間

數(shù)據(jù)備份

副本安置：第一步

副本選擇

安全模式

文件系統(tǒng)元數(shù)據(jù)持久化

通信協(xié)議

健壯性

數(shù)據(jù)磁盤故障，心跳檢測和重備份

集群重平衡

數(shù)據(jù)完整性

元數(shù)據(jù)磁盤故障

快照

數(shù)據(jù)組織

數(shù)據(jù)block

備份管道

可訪問性

空間回收

文件刪除和恢復

降低備份因子

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

數(shù)據(jù)磁盤故障，心跳檢測和重備份