超融合架構(gòu)是軟件定義數(shù)據(jù)中心的一種表現(xiàn)形式,是基于標(biāo)準(zhǔn)通用的硬件平臺,通過軟件定義實(shí)現(xiàn)計算、存儲、網(wǎng)絡(luò)融合,實(shí)現(xiàn)以虛擬化為中心的軟件定義數(shù)據(jù)中心的軟硬一體化IT基礎(chǔ)架構(gòu)。
1. 概述
傳統(tǒng)數(shù)據(jù)中心主要由服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備以及附屬設(shè)備,而這些設(shè)備通常由多家供應(yīng)商提供。因此,隨著業(yè)務(wù)應(yīng)用程序及其產(chǎn)生的數(shù)據(jù)的增長,設(shè)備種類和數(shù)量也隨之增加,從而導(dǎo)致運(yùn)維的成本和設(shè)備部署的周期也迅速增加,同時也增加了資源調(diào)度的難度,降低了系統(tǒng)資源的利用效率。
為了解決這一問題,由同一廠商或者若干家廠商聯(lián)合提供的融合系統(tǒng)開始出現(xiàn),將服務(wù)器、網(wǎng)絡(luò)設(shè)備和存儲設(shè)備等集成在同一個機(jī)柜或者機(jī)架上銷售給客戶,從而降低部署難度,提升資源利用效率。但是融合系統(tǒng)只是服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備的簡單“粘合”,一體化交付,盡可能“開箱即用”。雖然理論上只要三者搭配得當(dāng),各種類型的應(yīng)用都可以很好的支持。而在實(shí)際應(yīng)用中,服務(wù)器和存儲等計算資源還是獨(dú)立管理、獨(dú)立擴(kuò)展,仍然無法擺脫傳統(tǒng)存儲價格高企,運(yùn)維成本高,升級擴(kuò)容困難等問題。

超融合架構(gòu)以軟件定義存儲為核心,使用大量標(biāo)準(zhǔn)的x86服務(wù)器組成集群,通過虛擬化計算(KVM,VMware,Hyper-v,Xen,容器等)和虛擬化網(wǎng)絡(luò)(軟件定義網(wǎng)絡(luò)SDN)技術(shù),把分布在每個節(jié)點(diǎn)上的服務(wù)器本地資源天然(native)融合起來,形成統(tǒng)一資源池,通過統(tǒng)一管理界面向外暴露標(biāo)準(zhǔn)的計算、存儲、網(wǎng)絡(luò)能力,實(shí)現(xiàn)模塊化的無縫橫向擴(kuò)展(Scale-Out)。集群中各節(jié)點(diǎn)間沒有明確的計算和存儲的分工,不存在單點(diǎn)故障,可以根據(jù)需要對計算、存儲、網(wǎng)絡(luò)按需進(jìn)行橫向的動態(tài)擴(kuò)展。運(yùn)行在每個服務(wù)器節(jié)點(diǎn)上的單一的、高度虛擬化的超融合軟件棧,通過網(wǎng)絡(luò)和分布式算法同時為CPU、內(nèi)存、硬盤、網(wǎng)絡(luò)等物理資源提供抽象化功能,從而建立起一個同質(zhì)化的、具有高度可用性和彈性的存儲及計算資源池。

相對于傳統(tǒng)IT架構(gòu),超融合架構(gòu)具有如下優(yōu)勢:
- 單一支持:計算、存儲和網(wǎng)絡(luò)融合,統(tǒng)一部署,單一廠商提供所有軟硬件(計算、存儲和虛擬化等)支持;
- 部署簡便:無需劃分Zone、RAID等,從上機(jī)架開始最快30分鐘內(nèi)即可交付使用;
- 降低TOC(總擁有成本):資源池化,無需一次性大規(guī)模采購,按需采購,水平擴(kuò)容;
- 重復(fù)利用:充分利用舊設(shè)備,保護(hù)現(xiàn)有投資,延伸到云計算架構(gòu);
- 減小依賴:采用標(biāo)準(zhǔn)服務(wù)器,不依賴具體軟硬件廠商;
- 簡化管理:單一界面統(tǒng)一管理計算、存儲、虛擬化等資源,運(yùn)維管理簡單化;
- 彈性擴(kuò)展:分布式架構(gòu),線性擴(kuò)展,無節(jié)點(diǎn)數(shù)限制,無單點(diǎn)故障,內(nèi)置本地備份、同城和異地容災(zāi)能力;
- 高效利用:多節(jié)點(diǎn)并發(fā)訪問,本地訪問SSD加速,數(shù)據(jù)自動負(fù)載均衡,快速鏡像和恢復(fù)。
超融合架構(gòu)適用于必須運(yùn)行在物理硬件環(huán)境中的應(yīng)用之外的所有場景,但是目前主要適用于如下場景:
- 服務(wù)器虛擬化場景:由于超融合架構(gòu)可以將計算、存儲和網(wǎng)絡(luò)資源虛擬化后在圖形界面中進(jìn)行統(tǒng)一管理,因此能夠簡化虛擬化的配置管理;
- 虛擬桌面(VDI):超融合架構(gòu)能夠解決啟動風(fēng)暴問題,因此產(chǎn)生之初最主要的部署場景就是VDI;
- 容災(zāi)系統(tǒng):容災(zāi)系統(tǒng)需要快速,簡便,適應(yīng)性強(qiáng),擴(kuò)展方便,而超融合的快速部署、按需配置和擴(kuò)容等特性,能讓容災(zāi)變的異常簡單,因此在容災(zāi)系統(tǒng)的生命力會越來越強(qiáng)大;
- ROBO(遠(yuǎn)程和分支辦公):超融合架構(gòu)節(jié)約空間,性能出色,擴(kuò)容簡便,維修方便,適應(yīng)性強(qiáng),可以在分支機(jī)構(gòu)IT支持不夠的條件下提供高性能,高可靠性,易維護(hù),易管理的IT系統(tǒng),提高ROBO環(huán)境的辦公效率;
- 私有云:私有云對于IAAS層的要求是簡單,高效,彈性,敏捷,強(qiáng)健,虛擬化層適應(yīng)性強(qiáng),兼容性好;而這些特性都是超融合最擅長,與生俱來的,因此隨著超融合的蓬勃發(fā)展,對比傳統(tǒng)架構(gòu)這些優(yōu)勢愈發(fā)顯著。
2. 發(fā)展現(xiàn)狀
2012年Steve Chambers和Forrester咨詢首次提出超融合基礎(chǔ)架構(gòu)概念以來,其技術(shù)已經(jīng)從最初簡單的以替換傳統(tǒng)存儲廠商集中式存儲為目的,到如今的 從Iaas層(Infrastructure as a Service)融合向Paas層(Platform as a Service)技術(shù),并嘗試結(jié)合容器技術(shù),提供更多樣的服務(wù),技術(shù)日趨成熟。

2014年之前是HCI概念提出、市場試水的階段,如今Gartner HCI魔力象限中的絕大多數(shù)超融合廠商,如Nutanix、Dell EMC、VMware、華為、思科等均是在該階段開啟了HCI之路。2015~2016年,隨著云計算的爆棚,HCI被視為最具潛力的數(shù)據(jù)中心基礎(chǔ)架構(gòu)之一,發(fā)展駛?cè)肟燔嚨溃?016年甚至被稱之為“超融合元年”。
國際數(shù)據(jù)公司(IDC)認(rèn)為,雖然超融合系統(tǒng)在整個融合系統(tǒng)市場中所占的比例還不夠大,但全球的HCI市場在2021年之前會有平均28.9%的年復(fù)合增長,而整個市場營收會達(dá)到 83億美元的規(guī)模,因此高速增長的勢頭有望迅速抹平差距。

Gartner預(yù)計,超融合系統(tǒng)年復(fù)合增長率為48%左右,而中國將超越這一數(shù)字,并在2020年成為數(shù)據(jù)中心的主流;2021年,60%以上的超融合基礎(chǔ)設(shè)施(HCI)采用將偏向虛擬桌面基礎(chǔ)架構(gòu)(VDI)和遠(yuǎn)程辦公/分支機(jī)構(gòu)(ROBO)工作負(fù)載;軟件定義網(wǎng)絡(luò)(SDN)將在大多數(shù)HCI產(chǎn)品中可用,然而最終用戶采用率仍將低于10%。
超融合架構(gòu)的優(yōu)勢和客戶價值已經(jīng)勿容置疑,全球和國內(nèi)市場都已經(jīng)初步形成,HCI是未來5-10年新一代數(shù)據(jù)中心基礎(chǔ)架構(gòu)的首選方案。
在數(shù)據(jù)中心領(lǐng)域,超融合概念異?;鸨?,Nutanix和SimpliVity等初創(chuàng)公司備受追捧,并且隨著全球超融合市場呈現(xiàn)快速增長的勢頭,業(yè)內(nèi)無論是服務(wù)器巨頭、存儲巨頭等均加入了這一戰(zhàn)局。2018年,Gartner最新發(fā)布的超融合基礎(chǔ)設(shè)施魔力四象限中,國內(nèi)廠商僅有華為邁入挑戰(zhàn)者象限,但國際市場仍以Nutanix、Dell EMC、VMware和收購了Simplivity的HPE(惠普企業(yè))為首。

國內(nèi)超融合市場主要分為如下幾個陣營:
- 傳統(tǒng)服務(wù)器廠商,例如浪潮、聯(lián)想、DELL EMC、HPE;
- 相關(guān)領(lǐng)域轉(zhuǎn)行的廠商,例如通信領(lǐng)域的華為、網(wǎng)絡(luò)設(shè)備領(lǐng)域的H3C、安全領(lǐng)域的深信服等;
- 超融合初創(chuàng)廠商,例如SmartX、達(dá)沃時代、大道云行、青云、神州云科、云宏等。
其中:
- Nutanix主要與聯(lián)想合作,采用X3650服務(wù)器,提供基于Nutanix的2U產(chǎn)品;
- Simplivity采用Cisco或Dell的定制服務(wù)器,但是被HPE收購后,實(shí)際上相關(guān)業(yè)務(wù)已經(jīng)并入H3C。
根據(jù)分布式文件系統(tǒng),超融合技術(shù)方案劃分為如下3種:
- 分布式文件系統(tǒng)自主開發(fā),支持多種虛擬化架構(gòu)(VMware、KVM、Hyper-v);代表產(chǎn)品是Nutanix,其分布式文件系統(tǒng)分別是NDFS;此外還有華為、SmartX、達(dá)沃時代、大道云行、青云等;
- 分布式文件系統(tǒng)自主開發(fā),僅支持自家虛擬化平臺,無法獨(dú)立部署;代表產(chǎn)品是EMC的VxRail,采用VMware + vSAN;
- 分布式文件系統(tǒng)基于開源軟件開發(fā),僅支持KVM虛擬化;代表產(chǎn)品是深信服,其分布式文件系統(tǒng)是基于GlusterFS的aSAN,此外還有H3C基于Ceph的UIS。
最近幾年,容器已經(jīng)成為數(shù)據(jù)中心新工作方式的標(biāo)志。容器作為一種輕量級、可移植、自包含的軟件打包技術(shù),使應(yīng)用程序可以在幾乎任何地方以相同的方式運(yùn)行。開發(fā)人員在自己筆記本上創(chuàng)建并測試好的容器,無需任何修改就能夠在生產(chǎn)系統(tǒng)的虛擬機(jī)、物理服務(wù)器或公有云主機(jī)上運(yùn)行。

容器作為繼大數(shù)據(jù)和云計算之后又一炙手可熱的技術(shù),而且未來相當(dāng)一段時間內(nèi)都會非常流行。因此許多公司,包括Google、SmartX等,都在研發(fā)基于容器的超融合解決方案,即在同一個物理服務(wù)器的虛擬化平臺上運(yùn)行虛擬機(jī)(VM)和容器,共享分布式存儲和軟件定義網(wǎng)絡(luò),并使用統(tǒng)一的界面進(jìn)行管理,從而更好的滿足用戶的需要。

3. 主流超融合廠商介紹
目前主流超融合廠商包括Nutanix、VMware、華為、H3C、SmartX等,下面分別進(jìn)行介紹:
3.1 Nutanix(路坦力)
Nutanix成立于2009年,是一家提供超融合解決方案的設(shè)備廠商,多次被IDC和Gartner評為超融合領(lǐng)域的領(lǐng)導(dǎo)者,具有深厚的技術(shù)沉淀,擁有美國專利與商標(biāo)局正式批準(zhǔn)的分布式軟件架構(gòu)專利。Nutanix軟件已經(jīng)部署在全球六千多家企業(yè),功能穩(wěn)定完善,超融合生態(tài)鏈中具有無可比擬的優(yōu)勢。但是,隨著HCI市場的擴(kuò)張和更加激烈的競爭,其業(yè)績?nèi)匀怀霈F(xiàn)了下滑。為了實(shí)現(xiàn)從超融合技術(shù)方案向云計算方案公司的轉(zhuǎn)型,Nutanix從2017年5月開始與IBM和Google合作,提供基于IBM Power Systems的數(shù)據(jù)中心軟硬件解決方案和橫跨私有云、公有云(Google Cloud)和邊緣云(Edge Cloud and IoT)的多云解決方案(Nutanix Calm)。此外,Nutanix還于2018年3月收購了業(yè)內(nèi)領(lǐng)先的云解決方案提供商Minjar,推出Nutanix Xi Cloud Services,通過Prism集中化數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件,將數(shù)據(jù)中心服務(wù)擴(kuò)展到云,避免將內(nèi)部部署服務(wù)擴(kuò)展到云的復(fù)雜性。
Nutanix的主要產(chǎn)品是分布式資源管理平臺Prism和分布式多資源管理器Acropolis,以及基于這兩個整合產(chǎn)品家族的NX系列軟硬件一體機(jī)。其中,Prism主要用于提供一鍵式的基礎(chǔ)架構(gòu)管理平臺,方便用戶統(tǒng)一管理各個超融合集群;而Acropolis則用于提供超融合的核心組件,分布式文件系統(tǒng)(DSF)和用于封裝虛擬機(jī)、存儲、容器等接口的應(yīng)用接口(AMF)。Prism和Acropolis服務(wù)需要運(yùn)行在每個物理機(jī)虛擬化平臺上的控制虛擬機(jī)(CVM)上,用以提供對外接口。
Prism提供HTML5 UI, REST API, CLI, PowerShell CMDlets等多種接口,用于管理如下功能:
- 運(yùn)行環(huán)境和硬件設(shè)備的健康和狀態(tài)信息,包括存儲的容量、IOPS、延遲,內(nèi)存和CPU的利用率,虛擬機(jī)的數(shù)目等;
- 虛擬機(jī)和容器的管理,包括創(chuàng)建、運(yùn)行、更新、監(jiān)控、刪除等;
- 服務(wù)器、磁盤和網(wǎng)絡(luò)的管理、監(jiān)控和健康檢查以及集群擴(kuò)展等;
- 容災(zāi)、公有云對接、快照、恢復(fù)等數(shù)據(jù)保護(hù)功能。
Acropolis是Nutanix方案的核心,其核心是使用分布式文件系統(tǒng)DSF和應(yīng)用接口層(AMF)實(shí)現(xiàn)存儲和計算能力的軟件定義,從而將易耗資源虛擬機(jī)、容器、存儲等與用戶應(yīng)用解耦,提供一致性的操作平臺,從而使得用戶應(yīng)用可以在虛擬機(jī)管理器、平臺、容器和各種云之間無縫遷移。
分布式文件系統(tǒng)DSF是從Nutanix原來的分布式文件系統(tǒng)HDFS擴(kuò)展而來,是Nutanix賴以生存的核心組件,通過使用Intel VT-d技術(shù),將管理SSD和HDD的SCSI控制器被直接傳遞到運(yùn)行著DSF控制模塊的控制虛擬機(jī)(CVM),從而形成統(tǒng)一的資源池,進(jìn)而提供給用戶虛擬機(jī)、容器等。
分布式文件系統(tǒng)DSF具有如下特點(diǎn):
-
支持多種虛擬機(jī)管理器:
- Acropolis Hypervisor:集群最少支持3個節(jié)點(diǎn),最多節(jié)點(diǎn)數(shù)沒有限制,每次最少擴(kuò)展1個節(jié)點(diǎn);每個節(jié)點(diǎn)和集群的VM數(shù)量取決于物理內(nèi)存;每個VM的最大內(nèi)存是2TB,每個VM的最大CPU數(shù)為物理CPU數(shù)目;
- VMwrae vSphere:集群最少3個節(jié)點(diǎn),最多64個節(jié)點(diǎn),每次最少擴(kuò)展2個節(jié)點(diǎn);每個節(jié)點(diǎn)最多1024個VM;每個集群最多8000個VM,每個VM的最大內(nèi)存是6128GB,每個VM最多128個虛擬CPU;此時可支持VMware VAAI接口,從而將某些磁盤操作從CPU轉(zhuǎn)移到存儲設(shè)備執(zhí)行,減輕CPU負(fù)擔(dān);
- Hyper-V:集群最少支持3個節(jié)點(diǎn),最多64個節(jié)點(diǎn),每次最少擴(kuò)展1個節(jié)點(diǎn);每個節(jié)點(diǎn)最多1024個VM;每個VM的最大內(nèi)存是1TB,每個VM最多64個虛擬CPU;
- Citrix XenServer:2017年開始支持,無進(jìn)一步信息。
-
支持多種文件系統(tǒng)訪問接口,可動態(tài)創(chuàng)建新的適配器接口:
3.冷熱數(shù)據(jù)分層,本地SSD優(yōu)先,自動磁盤均衡:
本地SSD利用率過高時,最近最少使用的數(shù)據(jù)會被遷移到集群中其他節(jié)點(diǎn)的SSD,從而降低本地SSD的空間,保證本地SSD寫入優(yōu)先,使得本地虛擬機(jī)盡可能不需要跨節(jié)點(diǎn)訪問存儲數(shù)據(jù);而只有當(dāng)整個集群的SSD利用率達(dá)到閥值時,才會將每個節(jié)點(diǎn)的SSD中的數(shù)據(jù)按照冷熱程度順序遷移到該節(jié)點(diǎn)的HDD硬盤中。
-
讀寫緩存獨(dú)立,提高IO性能,同時兼顧消重功能:
-
數(shù)據(jù)寫入時,除非是順序IO訪問,否則必須寫入本地SSD的寫緩沖opLog,然后同步復(fù)制到DSF自動選擇的同一個集群的某個節(jié)點(diǎn)上,并在opLog利用率達(dá)到閾值時寫入到擴(kuò)展存儲,即本地HDD或者集群內(nèi)部其他服務(wù)器的SSD和HDD;同時,所有數(shù)據(jù)寫入都會打上標(biāo)記,從而在數(shù)據(jù)進(jìn)入讀緩沖時進(jìn)行消重。
數(shù)據(jù)讀取時,優(yōu)先檢查寫緩沖opLog中是否存在需要的數(shù)據(jù),不存在則從橫跨內(nèi)存和SSD的Unified Cache讀緩沖查找數(shù)據(jù);讀緩沖中不存在時,則進(jìn)一步從擴(kuò)展存儲中加載數(shù)據(jù),并存放到讀緩沖的Single-touch池中;Single-touch池中的數(shù)據(jù)會根據(jù)LRU算法逐步刷到讀緩沖Multi-touch池的內(nèi)存段和SSD段,實(shí)現(xiàn)數(shù)據(jù)的進(jìn)一步分層。
!](https://upload-images.jianshu.io/upload_images/5574441-97769d744ed59cba.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
-
-
基于Apache Cassandra深度修改的Cassandra組件,使用環(huán)狀分布式數(shù)據(jù)庫保存元數(shù)據(jù)和其他重要數(shù)據(jù)和Paxos算法保證數(shù)據(jù)的一致性;引入RF(復(fù)制因子)和校驗(yàn)和基址,使得數(shù)據(jù)寫入opLog時同步復(fù)制和更新到其他節(jié)點(diǎn)的opLog,并發(fā)送應(yīng)答給寫入節(jié)點(diǎn),最后在滿足賦值因子(復(fù)制份數(shù))的情況下異步推送到擴(kuò)展存儲中,從而提供足夠的數(shù)據(jù)的冗余度和可用性:
此外,為了減少集群內(nèi)節(jié)點(diǎn)數(shù)量變化時元數(shù)據(jù)重映射的數(shù)據(jù)量,一致性散列算法被引入,以確保新節(jié)點(diǎn)被均勻的插入到環(huán)狀分布式數(shù)據(jù)庫的老節(jié)點(diǎn)之間,從而使得需要更新的數(shù)據(jù)量最少;
通過Cassandra和基于Apache Zookeeper組件,實(shí)現(xiàn)節(jié)點(diǎn)、模塊和機(jī)架的數(shù)據(jù)、元數(shù)據(jù)、配置數(shù)據(jù)等的感知,確保某個VM、節(jié)點(diǎn)、模塊、機(jī)架故障時,系統(tǒng)仍然能夠從副本中恢復(fù);
提供糾刪碼、在線壓縮、事后壓縮、彈性消重等多種存儲優(yōu)化技術(shù)并協(xié)同工作,減少配置復(fù)雜度,提高存儲利用效率;
-
采用基于vDisk虛擬映射的寫時重定向算法(redirect-on-write),提供快照克隆功能和基于快照克隆功能的容災(zāi)和復(fù)制功能,從而實(shí)現(xiàn)快速備份和恢復(fù):
-
提供云鏈接功能和跨物理站點(diǎn)擴(kuò)展能力,使得計算和存儲集群跨越私有云、公有云(亞馬遜AWS等)和不同地點(diǎn)的多個物理站點(diǎn),使用同樣的組件創(chuàng)建集群并加入管理,從而實(shí)現(xiàn)對本地集群原生容災(zāi)和復(fù)制功能的擴(kuò)展;其中存儲可以使用亞馬遜S3(AWS)或微軟BlobStore(Azure)提供的云磁盤;
通過網(wǎng)絡(luò)和數(shù)據(jù)訪問本地化,虛擬機(jī)和文件的影子克隆和讀取時遷移能力,優(yōu)先使用物理機(jī)本地網(wǎng)絡(luò)和存儲,降低網(wǎng)絡(luò)和存儲壓力。
Acropolis包含一個基于CentOS KVM開發(fā)的Acropolis Hypervisor,增加在線遷移、高可靠性、iSCSI重定向、容器調(diào)度等功能,通過PCI直通方式訪問磁盤,通過Linux內(nèi)核支持的Open vSwitch(OVS)功能提供虛擬化網(wǎng)絡(luò)功能。其中高可靠性功能通過預(yù)留主機(jī)和每個主機(jī)上預(yù)留VM資源兩種方式實(shí)現(xiàn),分別適用于同構(gòu)主機(jī)和異構(gòu)主機(jī),可在某個VM故障時迅速切換到預(yù)留主機(jī)或某個主機(jī)的預(yù)留VM上。
此外,Nutanix方案還集成了OpenStack,用于提供業(yè)界標(biāo)準(zhǔn)構(gòu)建和管理接口(Swift對象存儲等),包括:
- OpenStack控制器(OSC): 現(xiàn)存或新建的虛擬機(jī),用于提供OpenStack界面;
- Acropolis OpenStack驅(qū)動:用于將OpenStack控制器的OpenStack RPC轉(zhuǎn)換成Acropolis API調(diào)用;
-
Acropolis OpenStack虛擬機(jī)(OVM):通常裝有Acropolis OpenStack驅(qū)動的虛擬機(jī),也可以包含OpenStack控制器,通常作為一個輔助類型的虛擬機(jī)存在。
最后,Nutanix方案支持全閃存存儲方案以提高核心應(yīng)用效率,并可以外接傳統(tǒng)SAN存儲網(wǎng)絡(luò)以滿足更多需要。
3.2 VMware
VMware成立于1998年,是一家提供云計算和硬件虛擬化的軟件和服務(wù)的著名軟件公司,并號稱是第一個在x86架構(gòu)虛擬上成功商業(yè)化的公司。VMware與2004年被EMC收購,并于2016年通過Dell收購EMC成為Dell的子公司。VMware最初的產(chǎn)品是桌面虛擬化軟件VMware Workstation和企業(yè)級服務(wù)器虛擬機(jī)管理軟件VMware ESXi。
2009年,VMware開始開發(fā)開源多云Paas平臺Cloud Foundry的原型B29項(xiàng)目,隨后通過收購吸收SpringSource公司為亞馬遜EC2共有云平臺開發(fā)的Paas項(xiàng)目,與2011年發(fā)布Cloud Foundryde,吸收在2008年通過與思科合作開發(fā)分布式虛擬軟件交換機(jī),并與2011年4月發(fā)布Cloud Foundry,從而進(jìn)入云服務(wù)領(lǐng)域。目前,Cloud Foundry由Cloud Foundry基金會管理,可以部署到多家基礎(chǔ)設(shè)施提供商,包括VMware vSphere,OpenStack,Amazon Web Services,Microsoft Azure,Google Cloud Platform,阿里巴巴 Alicloud等。截至2018年4月,認(rèn)證提供商名單包括Atos Cloud Foundry、華為FusionStage、IBM Cloud Foundry、Pivotal Cloud Foundry、SAP云平臺、Swisscom應(yīng)用云等。
2013年,VMware發(fā)布提供IaaS服務(wù)的公有云vCloud Hybrid Service(現(xiàn)在的vCloud Air),并于2017年賣給了法國云提供商OVH。
2016年,由于戴爾收購EMC,VMware宣布重組,Workstation和Fusion背后的整個開發(fā)團(tuán)隊被解散,并隨后發(fā)布了VMware Workstation 12.5和Fusion 8.5版本以支持Windows10和Windows Server 2016。
目前,VMware的超融合產(chǎn)品包括全包式超融合設(shè)備VxRail、VxRack SDDC(軟件定義數(shù)據(jù)中心)和以 vSAN ReadyNode形式提供的超過 150種經(jīng)過認(rèn)證的平臺,其核心為緊密集成的服務(wù)器虛擬化平臺vSphere(ESXi為其中的Hypervisor組件)、集成在vSphere中的閃存優(yōu)化型高性能超融合存儲方案vSAN和適用于vSphere環(huán)境的統(tǒng)一且可延展的管理解決方案vCenter Server。此外,VMware還提供專為混合云而構(gòu)建的云管理平臺VMware vRealize Suite、集成軟件定義數(shù)據(jù)中心(SDDC)系統(tǒng)上部署和運(yùn)行私有云的解決方案VMware Cloud Foundation、虛擬桌面基礎(chǔ)架構(gòu)(VDI)產(chǎn)品VMware Horizo??n View、災(zāi)難恢復(fù)解決方案VMware Site Recovery Manager(SRM)以及網(wǎng)絡(luò)虛擬化產(chǎn)品VMware NSX等一些列云管理軟件。
VMware超融合軟件體系的核心是集成VMware vSAN的VMware vSphere服務(wù)器虛擬化平臺,具有以下特征:
僅能用于vSphere,集群最少3個節(jié)點(diǎn),最多64個節(jié)點(diǎn),每次最少擴(kuò)展2個節(jié)點(diǎn);每個節(jié)點(diǎn)的最多1024個VM;每個集群最多8000個VM,每個VM的最大內(nèi)存是6128GB,每個VM最多128個虛擬CPU;
-
與vSphere中的虛擬機(jī)管理器ESXi緊密集成,降低計算能力開銷;
-
支持混合vSAN集群和全閃存集群,以適應(yīng)不同的需求;
采用支持彈性、無中斷擴(kuò)展的分布式體系結(jié)構(gòu),可以增加新節(jié)點(diǎn)以橫向擴(kuò)展,也可以增加硬盤驅(qū)動器以縱向擴(kuò)展;
支持重復(fù)數(shù)據(jù)消除、壓縮和糾刪碼 (RAID 5/6) 、共享邏輯卷并發(fā)訪問等高級存儲功能,使存儲利用率提高多達(dá)10 倍,同時顯著降低存儲容量和成本;
通過vSphere Web Client管理,并與VMware 產(chǎn)品體系集成,包括 vMotion、High Availability (HA)和Fault Tolerance (FT) 等主要功能特性和其他VMware產(chǎn)品(VMware Site Recovery Manager、VMware vRealize Suite等);
集成業(yè)界首個具有靜態(tài)數(shù)據(jù)加密功能的原生HCI安全解決方案,支持客戶選擇標(biāo)準(zhǔn)驅(qū)動器(SSD 和 HDD)、雙因素身份驗(yàn)證(SecurID 和 CAC)和所有符合 KMIP 標(biāo)準(zhǔn)的密鑰管理器(如 CloudLink、Hytrust、SafeNet、Thales 和Vormetric),從而避免因?yàn)檫x擇自加密驅(qū)動器 (SED) 而導(dǎo)致選項(xiàng)有限并產(chǎn)生額外費(fèi)用;
支持虛擬機(jī)存儲和存儲服務(wù)級別(如容量、性能、可用性)根據(jù)存儲策略自動調(diào)整,以實(shí)現(xiàn)存儲資源負(fù)載均衡;
采用分布式RAID和緩存鏡像,內(nèi)置容錯和高級可用性功能,無縫支持vSphere可用性功能(vSphere Fault Tolerance、vSphere High Availability等);
-
提供VAAI(vStorage APIs for Array Integration)功能,可以將某些磁盤操作從CPU轉(zhuǎn)移到存儲設(shè)備執(zhí)行,減輕CPU負(fù)擔(dān):
-
Copy Offload(存儲端離線拷貝),適用于克隆或從模板創(chuàng)建虛擬機(jī)等情況;
-
Block Zeroing(塊清零),創(chuàng)建虛擬機(jī)時虛擬磁盤清零時使用可以保證后續(xù)運(yùn)行中的性能下降;
-
Atomic Test and Set(原子測試鎖定機(jī)制),硬件輔助的鎖定機(jī)制,用于并發(fā)訪問時針對整個邏輯卷中所有磁盤的鎖定釋放機(jī)制,通過存儲設(shè)備離線鎖定邏輯卷中某個磁盤來提高并發(fā)效率:
-
UNMAP/Reclaim:適用于刪除或釋放虛擬機(jī)時磁盤空間的釋放:
-
-
支持跨物理站點(diǎn)擴(kuò)展、雙節(jié)點(diǎn)直連等高級功能;
-
vCenter Server與vSphere緊密結(jié)合,能夠聚合多臺 ESXi 主機(jī)的物理資源,集中呈現(xiàn)靈活多變的資源,供系統(tǒng)管理員置備虛擬環(huán)境中的虛擬機(jī)。vCenter Server 組件包括用戶訪問控件、核心服務(wù)、分布式服務(wù)、插件以及各種界面;
vCenter Server提供vSphere Client、vSphere Web Client、vSphere命令行或終端服務(wù)(Windows 終端服務(wù))等多種訪問接口。
3.3 華為
華為作為傳統(tǒng)的通信設(shè)備制造商,于2012年9月華為云計算大會上發(fā)布了FusionCube 9000超融合設(shè)備,正式進(jìn)軍超融合市場,隨后在2014年6月首次進(jìn)入Gartner超融合魔力四象限,并在2017年成為首家進(jìn)入擠入挑戰(zhàn)者象限的中國企業(yè)。
目前,華為的超融合產(chǎn)品包括:
- 適用于適用于虛擬化、桌面云、大容量數(shù)據(jù)庫場景的FusionCube 2000;
- 適用于虛擬化和桌面云場景的FusionCube 6000;
- 適用于數(shù)據(jù)庫或虛擬化場景的FusionCube 9000;
- 經(jīng)過VMware認(rèn)證的全新一代服務(wù)器FusionCube vSAN Ready Nodes;
- 自帶FusionSphere云操作系統(tǒng)的FusionCube超融合方案。
華為FusionCube超融合基礎(chǔ)設(shè)施以計算/存儲/網(wǎng)絡(luò)融合、預(yù)集成、高性能、高可靠、高安全、業(yè)務(wù)自動化快捷部署、統(tǒng)一運(yùn)維管理、資源智能彈性伸縮為設(shè)計理念,是華為IT產(chǎn)品線的旗艦產(chǎn)品。其總體架構(gòu)如下所示:
華為FusionCube方案的核心是FusionCube Storage分布式存儲平臺,通過合理有序組織刀片服務(wù)器的本地硬盤,提供高性能高可靠的塊存儲業(yè)務(wù),其架構(gòu)如下所示:

- 管理模塊(Manager):提供告警、監(jiān)控、日志、配置等操作維護(hù)功能,通常工作在主備模式下;
- 代理進(jìn)程(Agent):各節(jié)點(diǎn)上與管理模塊通信的代理,可以各節(jié)點(diǎn)監(jiān)控與告警信息手機(jī)或節(jié)點(diǎn)軟件升級;
- Zookeeper:基于Apache ZooKeeper,用于為MDC集群提供選主仲裁,需要保持一半以上的活躍度;3節(jié)點(diǎn)起步,奇數(shù)個部署;
- 元數(shù)據(jù)控制(MDC):控制數(shù)據(jù)分布規(guī)則、數(shù)據(jù)重建規(guī)則、集群狀態(tài)等;3節(jié)點(diǎn)起步,最多96個;每個MDC最多管理2個資源池;每個資源池對應(yīng)1個歸屬M(fèi)DC,故障時則托管到其他MDC;主MDC負(fù)責(zé)監(jiān)控其他MDC;MDC負(fù)責(zé)
- 虛擬塊存儲管理組件(VBS):通過與對應(yīng)資源池的OSD之間的點(diǎn)對點(diǎn)通信,并發(fā)訪問硬盤和SSD,執(zhí)行卷元數(shù)據(jù)管理,從而提供包含CHAP身份驗(yàn)證的SCSI或iSCSI接口服務(wù);每個節(jié)點(diǎn)對應(yīng)1個或多個VBS進(jìn)程,并在啟動時與主MDC連接并協(xié)商出主VBS;
- KV(Key-Value)設(shè)備服務(wù)(OSD):執(zhí)行具體的I/O 操作;每塊磁盤對應(yīng)1個或多個OSD進(jìn)程以提升IO效率。
FusionCube Storage具有如下特點(diǎn):
支持業(yè)界主流的虛擬化平臺VMware ESXi、Xen、KVM以及華為基于Xen開發(fā)的FusionSphere等,集群最少3個節(jié)點(diǎn),最多288個節(jié)點(diǎn);使用VMware ESXi作為虛擬化平臺時最多64個節(jié)點(diǎn),但是可以支持VMware VAAI接口,從而將某些磁盤操作從CPU轉(zhuǎn)移到存儲設(shè)備執(zhí)行,減輕CPU負(fù)擔(dān);
支持每個集群最多128個資源池,以滿足不同性能存儲介質(zhì)和故障隔離要求;所有資源池共享同一套Zookeeper和MDC;2個副本時每個資源池最多支持96個硬盤,3個副本時2048個硬盤,但是類型和容量必須相同;每個資源池中各節(jié)點(diǎn)的硬盤數(shù)相差不得超過2個,且硬盤差額之和不得超過最大硬盤數(shù)的33%;
-
同時提供塊存儲(SCSI/iSCSI)、對象存儲(亞馬遜S3/OpenStack Swift)和文件存儲(NFS/CIFS等)服務(wù)以及針對不同接口的增強(qiáng)服務(wù);
-
基于ROW(Redirect-On-Write)機(jī)制的快照技術(shù),減少對初始卷的影響:
-
基于同樣被Nutanix采用的DHT路由(分布式一致性Hash)技術(shù)實(shí)現(xiàn)自動精簡配置功能(SmartThin/HyperThin等),即初始化時將硬盤劃分為1M字節(jié)的分區(qū),并在內(nèi)存創(chuàng)建與物理硬盤的映射關(guān)系盡可能將數(shù)據(jù)均分到所有節(jié)點(diǎn)中,并減少新節(jié)點(diǎn)增加時需要更新的數(shù)據(jù)量,從而在此基礎(chǔ)上實(shí)現(xiàn)存儲空間的按需分配和動態(tài)映射,提供超越實(shí)際物理存儲的虛擬存儲資源,顯著提高存儲空間利用率;
-
基于雙令牌桶算法(C桶存放令牌,E同存放余額)的QoS功能,用于對I/O進(jìn)行精細(xì)化控制并提供burst功能(即允許短期內(nèi)從超出IOPS配置份額的訪問):
-
基于臨時節(jié)點(diǎn)的Hint可用性增強(qiáng),通過將IO臨時寫入快速擴(kuò)開辟的hint節(jié)點(diǎn)后通過過后臺延時任務(wù)寫入原目的節(jié)點(diǎn)的方式,在1~2分鐘內(nèi)快速解決節(jié)點(diǎn)亞健康狀態(tài):
- 通過NFS多路徑、CIFS多通道、NFS協(xié)議調(diào)優(yōu)等技術(shù),提高NFS、CIFS等文件系統(tǒng)接口效率;
-
兼容主流大數(shù)據(jù)平臺,包括華為FusionInsight、Cloudera CDH、Hadoop等大數(shù)據(jù)平臺的對接;
- 通過為OpenStack開源云平臺各存儲模塊實(shí)現(xiàn)的Provider,提供與主流發(fā)布版本和商業(yè)版本的對接能力;
- 通過對SNMP(簡單網(wǎng)絡(luò)管理協(xié)議)和SMI-S(存儲管理計劃 - 規(guī)范)標(biāo)準(zhǔn)協(xié)議的支持,實(shí)現(xiàn)對主流IT運(yùn)維管理平臺的支持;
-
-
數(shù)據(jù)分層,多級cache,讀寫分離,本地優(yōu)先,提高性能:
- 寫入時,首先以同步方式寫入到本節(jié)點(diǎn)SSD cache以及數(shù)據(jù)副本所在其他節(jié)點(diǎn)的SSD Cache,全部寫成功后才返回成功;隨后,SSD Cache 中的數(shù)據(jù)會異步刷入到硬盤;然后周期性或達(dá)到閾值后批量寫入硬盤;
- 讀取時,優(yōu)先從本地節(jié)點(diǎn)的cache中讀取數(shù)據(jù),故障時才會選擇副本節(jié)點(diǎn);選中節(jié)點(diǎn)后,首先檢查內(nèi)存讀Cache中,存在時調(diào)整該數(shù)據(jù)到讀Cache LRU隊首并返回數(shù)據(jù),否則檢查SSD中的讀Cache;存在時增加該數(shù)據(jù)的熱點(diǎn)訪問因子并返回,否則繼續(xù)檢查SSD中額寫Cache;存在時增加該數(shù)據(jù)的熱點(diǎn)訪問因子并返回,同時在熱點(diǎn)訪問因子達(dá)到閾值后將數(shù)據(jù)緩存到SSD中的讀Cache,失敗則從硬盤讀取數(shù)據(jù),增加該數(shù)據(jù)的熱點(diǎn)訪問因子并返回,同時在熱點(diǎn)訪問因子達(dá)到閾值后將數(shù)據(jù)緩存到SSD中的讀Cache。
-
文件存儲接口采用業(yè)界先進(jìn)的動態(tài)子樹技術(shù),支持百萬數(shù)量級的超大目錄,訪問響應(yīng)與普通目錄基本沒有差別;其中,整個文件系統(tǒng)采用統(tǒng)一命名空間,需要根據(jù)所在節(jié)點(diǎn)將目錄樹劃分為若干子樹,并在子文件過多或子文件訪問熱度超過閾值時分裂;每個子樹對應(yīng)于1個MDC(元數(shù)據(jù)管理模塊),而每個MDC可以管理多個子樹;
-
通過數(shù)據(jù)條帶化技術(shù)將寫入的數(shù)據(jù)劃分為N個固定大小的源數(shù)據(jù)分片(條帶Strip),然后計算出M個冗余數(shù)據(jù)分片(條帶Strip),從而組成一個N+M的數(shù)據(jù)分條(Stripe),然后按照數(shù)據(jù)保護(hù)級別選擇不同的節(jié)點(diǎn)分散存放,從而實(shí)現(xiàn)數(shù)據(jù)的并行訪問和故障恢復(fù):
支持大塊或順序訪問IO直接落盤(HDD)技術(shù),充分利用HDD順序訪問和SDD隨機(jī)訪問的優(yōu)勢,提高SD卡壽命和SD Cache命中率;
通過SSD Cache讀寫空間動態(tài)調(diào)整技術(shù),根據(jù)系統(tǒng)運(yùn)行場景自動均衡讀寫Cache比例,最大程度上發(fā)揮SD Cache作用;
-
提供設(shè)備、網(wǎng)絡(luò)、業(yè)務(wù)和管理的全面安全解決方案,確保系統(tǒng)安全可靠:
支持存儲和計算節(jié)點(diǎn)分離部署以及自動化部署,部署和維護(hù)更加靈活方便。
3.4 H3C(新華三)
H3C最初與2003年由華為和美國老牌網(wǎng)絡(luò)設(shè)備廠商3Com合資成立的一家網(wǎng)絡(luò)設(shè)備制造廠商,歷經(jīng)多次股東變化,目前大股東包括華為、3COM、HP、紫光等,但是仍然占據(jù)中國企業(yè)網(wǎng)絡(luò)設(shè)備市場龍頭地位。惠普企業(yè)收購的Simplivity相關(guān)超融合產(chǎn)品也一并合入新華三。
除了惠普企業(yè)轉(zhuǎn)入的Simplivity超融合產(chǎn)品,H3C還面向IaaS(基礎(chǔ)架構(gòu)即服務(wù))推出了基于OpenStack和KVM的全基礎(chǔ)架構(gòu)軟件定義超融合解決方案H3C UIS(統(tǒng)一基礎(chǔ)架構(gòu)系統(tǒng)),包含UIS Manager統(tǒng)一管理矩陣、UIS8000 刀片式超融合設(shè)備、UIS Cell 機(jī)架式超融合設(shè)備等,是最早推出超融合解決方案的中國企業(yè),曾將在超融合市場連續(xù)兩年中占據(jù)致中國第一,世界第三。
UIS基于開源的KVM虛擬化,包括如下核心組件:
-
UIS Manager(統(tǒng)一管理矩陣):系統(tǒng)中服務(wù)器、交換機(jī)、KVM控制器等各個組件進(jìn)行統(tǒng)一管理的一站式管理平臺,提供業(yè)界最全的數(shù)據(jù)中心管理功能,將計算、存儲、網(wǎng)絡(luò)和安全這四個IT的資源進(jìn)行深度的內(nèi)核級融合和開發(fā),具備資源一站式監(jiān)控、設(shè)備自助上線、應(yīng)用一鍵部署、資源彈性擴(kuò)展、問題事件快速處理等特點(diǎn):
-
CAS(虛擬化平臺):基于Linux + KVM,從計算、存儲、網(wǎng)絡(luò)和安全等四個領(lǐng)域進(jìn)行深度的內(nèi)核級融合和開發(fā),集成Intel DPDK等開源模塊,與占據(jù)運(yùn)營商領(lǐng)域半壁江山的亞信安全軟件實(shí)現(xiàn)內(nèi)核級對接,支持VMware vSPhere虛擬化內(nèi)核即EXSi,并且可以與H3C的NFV軟件集成;
-
ONEStor(分布式存儲) :基于開源分布式文件系統(tǒng)Ceph深度修改,采用分布式管理集群,分布式哈希數(shù)據(jù)分布算法,分布式無狀態(tài)客戶端、分布式Cache等全分布式架構(gòu),提供線性擴(kuò)展能力、多副本、數(shù)據(jù)強(qiáng)一致性等功能和塊、文件和對象存儲等多種接口:
3.5 SmartX(北京志凌海納科技)
SmartX成立于2013年,是中國領(lǐng)先的超融合產(chǎn)品與企業(yè)云解決方案創(chuàng)業(yè)公司,其技術(shù)團(tuán)隊主要由來自Nimbula、Microsoft、百度、HP、EMC、Redhat、Citrix,VMware等公司的優(yōu)秀工程師組成,具有豐富的虛擬化、分布式系統(tǒng)研發(fā)和大規(guī)模運(yùn)維經(jīng)驗(yàn),并在去年拿到了經(jīng)緯創(chuàng)投領(lǐng)投的近億B輪投資。SmartX的理念是通過軟件重新定義數(shù)據(jù)中心,將類似 Google 等互聯(lián)網(wǎng)公司數(shù)據(jù)中心的架構(gòu)帶給企業(yè),并結(jié)合最新的硬件趨勢,為企業(yè)構(gòu)建更快速,更易擴(kuò)展,更靈活的數(shù)據(jù)中心。SmartX落地的聯(lián)通云數(shù)據(jù)有限公司沃云平臺具有超過2000節(jié)點(diǎn)和24TB數(shù)據(jù),是得到Granter認(rèn)可的國內(nèi)最大規(guī)模超融合案例。
SmartX的產(chǎn)品是SmartX Halo超融合平臺和SmartX Halo一體機(jī)。
SmartX Halo超融合平臺基于自主研發(fā)的ZBS分布式文件系統(tǒng),提供分布式塊存儲、數(shù)據(jù)保護(hù)、網(wǎng)絡(luò)管理等 IT 基礎(chǔ)服務(wù),實(shí)現(xiàn)“一站式”超融合虛擬化平臺解決方案,具有以下特點(diǎn):
- 100% 軟件定義技術(shù),實(shí)現(xiàn)數(shù)據(jù)中心的 IT 基礎(chǔ)服務(wù);
- 無硬件平臺綁定,支持不同廠商多種型號x86 服務(wù)器;
- 無虛擬化軟件鎖定,生態(tài)友好,支持VMware vSphere、Citrix XenServer、Linux KVM 等Hypervisor
- 按需同時水平擴(kuò)展容量和性能,支持無停機(jī)擴(kuò)容,擴(kuò)容簡單,對線上業(yè)務(wù)無影響;
-
全分布式設(shè)計,數(shù)據(jù)冗余,智能數(shù)據(jù)恢復(fù),確保業(yè)務(wù)可靠可用;
- 支持NFS和iSCSI協(xié)議以及開放API,方便與OpenStack等各類云平臺集成;
- 內(nèi)置虛擬化平臺、虛擬網(wǎng)絡(luò)管理和運(yùn)維管理軟件,輕松部署,簡化管理,降低 IT 運(yùn)維成本。
SmartX超融合平臺的核心是ZBS分布式塊存儲文件系統(tǒng),由安裝在每個節(jié)點(diǎn)上的vSphere、XenServer、KVM 等Hypervisor上的SCVM(SmartX Controller Virtual Machine)通過網(wǎng)絡(luò)組成分布式存儲集群來提供虛擬的塊設(shè)備存儲池,具有如下特點(diǎn):
-
支持兩級LRU隊列模式的SSD智能緩存技術(shù)、IO寫請求合并優(yōu)化技術(shù)和核心業(yè)務(wù)專用的SSD存儲池技術(shù),提高IO訪問速度和SSD使用效率;
- 支持無停機(jī)擴(kuò)容、硬盤熱插拔、VM重連、VM熱遷移等技術(shù),確保業(yè)務(wù)連續(xù)性;
- 支持彈性多副本、數(shù)據(jù)塊校驗(yàn)、秒級無依賴快照和回滾、增量去冗備份工具、智能數(shù)據(jù)恢復(fù)、集群負(fù)載均衡、全局瘦供給(ThinProvision )等技術(shù),確保數(shù)據(jù)安全可靠;
- 支持命令行/Web管理接口、RESTFUL/Python開放接口、集群監(jiān)控和報警軟件等,簡化IT管理。
SmartX ZBS的基礎(chǔ)架構(gòu)如下所示:
其中: - ZooKeeper服務(wù):基于Apache ZooKeeper,用于為Meta(元數(shù)據(jù))服務(wù)提供選主仲裁,需要保持一半以上的活躍度;3節(jié)點(diǎn)起步,奇數(shù)個部署;
- Meta服務(wù):管理元數(shù)據(jù),包括維護(hù)數(shù)據(jù)塊(8K字節(jié))到具體物理服務(wù)器的映射,執(zhí)行元數(shù)據(jù)同步、負(fù)載均衡、數(shù)據(jù)主動恢復(fù)、垃圾回收等集群層面的策略任務(wù);每個節(jié)點(diǎn)1個;
- Chunk服務(wù):管理本地存儲資源(SATA和SSD等),充分挖掘SSD的特性來優(yōu)化本地I/O性能;每個節(jié)點(diǎn)1個。
SCVM(SmartX Controller Virtual Machine)上需要安裝一款融合虛擬計算、分布式存儲及虛擬網(wǎng)絡(luò)的基于Linux的操作系統(tǒng)SmartX OS,用于為用戶構(gòu)建完整的超融合虛擬化IT基礎(chǔ)架構(gòu)。
4. 超融合技術(shù)總結(jié)
4.1 關(guān)鍵技術(shù)
除了VMware之類缺少詳細(xì)資料的,主流超融合廠家通常都采用了如下關(guān)鍵技術(shù):
統(tǒng)一管理界面:通過統(tǒng)一界面管理系統(tǒng)中的計算、存儲、網(wǎng)絡(luò)等節(jié)點(diǎn)并提供在線升級、無縫水平擴(kuò)容等功能;
-
I/O MMU虛擬化技術(shù):用于CVM直接訪問硬盤控制器和網(wǎng)卡等,包括架構(gòu)無關(guān)的的PCI單根I/O虛擬化技術(shù)(SR-IOV)和各個主流處理器架構(gòu)的IOMMU技術(shù)(英特爾的VT-d、AMD的AMD-Vi、ARM的SMMU、Power的PAMU/IOMMU等);其中SR-IOV技術(shù)已經(jīng)廣泛應(yīng)用于各種架構(gòu)的處理器和PCI設(shè)備,但是需要配合IOMMU技術(shù)使用;
-
分布式KV(Key-Value)存儲技術(shù):通過分布式一致性Hash(DHT路由)、HASH分片、CRUSH算法等為數(shù)據(jù)塊生成key,然后映射到邏輯分區(qū),進(jìn)而將邏輯分區(qū)映射到不同存儲節(jié)點(diǎn)上不同硬盤的真實(shí)分區(qū):
-
Apache ZooKeeper:曾經(jīng)屬于Hadoop,目前為頂級獨(dú)立項(xiàng)目,通過將數(shù)據(jù)以冗余方式分散存儲在分層名稱空間中來支持為大型分布式計算提供開源的高可用性分布式配置服務(wù)、同步服務(wù)和命名注服務(wù),具有以下特性:
- 高可靠:3節(jié)點(diǎn)起步,奇數(shù)個部署,自動選擇主節(jié)點(diǎn),單節(jié)點(diǎn)故障不影響系統(tǒng)運(yùn)行;
- 架構(gòu)簡潔:通過共享分層命名空間來協(xié)調(diào)整個系統(tǒng);
- 可伸縮:可通過增加節(jié)點(diǎn)提升系統(tǒng)性能;
- 快速處理:讀取操作多于寫入的讀取主導(dǎo)場景中事務(wù)處理尤其快速。
自動多級緩沖/SSD加速技術(shù):根據(jù)數(shù)據(jù)訪問頻率自動劃分冷熱數(shù)據(jù),通過LRU算法將熱門數(shù)據(jù)放入內(nèi)存和SSD等高速緩沖,冷門數(shù)據(jù)后臺刷新到HDD硬盤;
寫時重定向ROW(redirect-on-write)或?qū)憰r復(fù)制COW(copy-on-write)算法,提供快照克隆功能和基于快照克隆功能的容災(zāi)和復(fù)制功能,從而實(shí)現(xiàn)快速備份和恢復(fù);
vSwitch技術(shù):提供網(wǎng)絡(luò)虛擬化功能,包括VMware VDS(vSphere Distributed Switch)和Linux內(nèi)核支持的Open vSwitch(OVS)等技術(shù)。








