一、背景
存儲(chǔ)是過去、現(xiàn)在和未來電腦、AI、企業(yè)信息化和云計(jì)算的核心。在存儲(chǔ)和管理數(shù)據(jù)方面,有現(xiàn)代的云原生方式,也有傳統(tǒng)的面向設(shè)備的方式。
不用說,對(duì)象存儲(chǔ)是更現(xiàn)代的存儲(chǔ)。在很多對(duì)象存儲(chǔ)里面,MinIO無可救藥地偏向和選擇了對(duì)象存儲(chǔ)(畢竟這是我們唯一做的事情)。對(duì)象存儲(chǔ)是是很簡單的。但是,這會(huì)遺漏一個(gè)關(guān)鍵點(diǎn)——即 MinIO 背后的團(tuán)隊(duì)構(gòu)建了 GlusterFS。
鑒于 Gluster 曾經(jīng)是(并且可能仍然是)市場上最優(yōu)雅和功能最強(qiáng)大的分布式文件系統(tǒng)之一,團(tuán)隊(duì)展望未來并創(chuàng)辦了一家對(duì)象存儲(chǔ)公司這一事實(shí)應(yīng)該告訴你這不是 MinIO 的唯一重點(diǎn),它是關(guān)于什么是最具功能性、可擴(kuò)展性和彈性的數(shù)據(jù)解決方案。
與傳統(tǒng)的 SAN 和 NAS 解決方案相比,對(duì)象存儲(chǔ)具有根本優(yōu)勢(shì)。在此篇文章中,我們將深入探討對(duì)象存儲(chǔ)的優(yōu)勢(shì)以及它為何成為許多組織的首選存儲(chǔ)解決方案。
二、可擴(kuò)展性
對(duì)象存儲(chǔ)相對(duì)于 SAN/NAS 最明顯的優(yōu)勢(shì)之一是它的可擴(kuò)展性。隨著數(shù)據(jù)量的增長,傳統(tǒng)的 SAN 和 NAS 解決方案變得非常昂貴(資本支出和運(yùn)營支出)。它們根本不是為規(guī)模而設(shè)計(jì)的。另一方面,對(duì)象存儲(chǔ)旨在處理大量數(shù)據(jù),并且可以根據(jù)需要輕松擴(kuò)展,而無需對(duì)基礎(chǔ)架構(gòu)進(jìn)行任何重大更改。這種可擴(kuò)展性是通過使用分布式架構(gòu)和基于軟件的糾刪碼實(shí)現(xiàn)的。對(duì)象存儲(chǔ)系統(tǒng)通常由許多單獨(dú)的存儲(chǔ)節(jié)點(diǎn)組成,這些節(jié)點(diǎn)協(xié)同工作以存儲(chǔ)和管理數(shù)據(jù)。隨著新節(jié)點(diǎn)被添加到系統(tǒng)中,系統(tǒng)的整體容量和性能都會(huì)增加。大規(guī)模性能是當(dāng)今企業(yè)的一個(gè)關(guān)鍵概念,這就是像 MinIO 這樣的現(xiàn)代高性能對(duì)象存儲(chǔ)可以提供的。
三、成本效益
由于對(duì)象存儲(chǔ)旨在處理大量數(shù)據(jù),因此它通常比傳統(tǒng)的 SAN 和 NAS 解決方案更具成本效益。對(duì)于需要存儲(chǔ)大量非結(jié)構(gòu)化數(shù)據(jù)(如媒體文件、備份和存檔)的組織來說尤其如此。應(yīng)該注意的是,MinIO 的“massive”和傳統(tǒng) SAN/NAS 解決方案的“massive”是完全不同的。SAN/NAS 的“海量”約為 1PB。這在對(duì)象存儲(chǔ)世界中很小。現(xiàn)在每個(gè)人都有一個(gè) PB——甚至是家庭實(shí)驗(yàn)室的人。海量對(duì)象存儲(chǔ)是 EB 級(jí)規(guī)模并且還在不斷增長。
在存儲(chǔ)利用率方面,對(duì)象存儲(chǔ)也非常高效。傳統(tǒng)的 SAN 和 NAS 系統(tǒng)通常有很高的開銷,這意味著很大一部分可用存儲(chǔ)空間被系統(tǒng)本身消耗掉了。另一方面,對(duì)象存儲(chǔ)的設(shè)計(jì)非常高效,這意味著您可以物有所值。
這是你可以自己測(cè)試的東西。查看我們的糾刪碼計(jì)算器。它使您能夠直接了解您在不同奇偶校驗(yàn)選項(xiàng)下的使用情況。嘗試找到愿意提供這種透明度的 SAN/NAS 供應(yīng)商。你不會(huì)因?yàn)樗麄儾幌矚g談?wù)撍?/p>
數(shù)據(jù)持久性
對(duì)象存儲(chǔ)被設(shè)計(jì)成高度持久和容錯(cuò)的。這意味著即使個(gè)別磁盤或服務(wù)器出現(xiàn)故障,您的數(shù)據(jù)仍然是安全的并且可以訪問。此外,MinIO 的內(nèi)置復(fù)制和數(shù)據(jù)保護(hù)功能確保數(shù)據(jù)始終受到保護(hù)和可用。
MinIO 的擦除編碼方法經(jīng)過高度優(yōu)化(針對(duì)性能和彈性),糾刪碼為分布式存儲(chǔ)提供數(shù)據(jù)保護(hù),因?yàn)樗哂袕椥院托?。它將?shù)據(jù)文件拆分為數(shù)據(jù)和奇偶校驗(yàn)塊并對(duì)其進(jìn)行編碼,以便即使部分編碼數(shù)據(jù)不可用,也可以恢復(fù)主要數(shù)據(jù)。水平可擴(kuò)展的分布式存儲(chǔ)系統(tǒng)依靠擦除編碼通過跨多個(gè)驅(qū)動(dòng)器和節(jié)點(diǎn)保存編碼數(shù)據(jù)來提供數(shù)據(jù)保護(hù)。如果驅(qū)動(dòng)器或節(jié)點(diǎn)發(fā)生故障或數(shù)據(jù)損壞,可以從保存在其他驅(qū)動(dòng)器和節(jié)點(diǎn)上的塊中重建原始數(shù)據(jù)。
四、輔助功能
可以隨時(shí)隨地在任何設(shè)備上訪問對(duì)象存儲(chǔ)。此外,對(duì)象存儲(chǔ)設(shè)計(jì)為 API 驅(qū)動(dòng),這意味著開發(fā)人員可以輕松地將其集成到他們的應(yīng)用程序和工作流中。大多數(shù) SAN 僅限于遺留數(shù)據(jù)中心協(xié)議并僅限于單個(gè)數(shù)據(jù)中心。
這真的很重要!
在構(gòu)建現(xiàn)代 Web 應(yīng)用程序時(shí),RESTful API 從根本上優(yōu)于 POSIX。雖然有些人可能會(huì)爭辯說這些技術(shù)有不同的用途,但在我們生活的云原生世界中,RESTful API 占主導(dǎo)地位。人們根本不會(huì)使用 POSIX 構(gòu)建新的應(yīng)用程序。
第一, RESTful API 在數(shù)據(jù)交換和通信協(xié)議方面提供了更大的靈活性。
與主要為文件系統(tǒng)訪問而設(shè)計(jì)的 POSIX 不同,RESTful API 可以處理范圍廣泛的數(shù)據(jù)類型,從簡單的文本字符串到復(fù)雜的多媒體文件。這使得它更容易與不同的應(yīng)用程序、平臺(tái)和設(shè)備集成,并處理不同的用例。
第二,RESTful API 被設(shè)計(jì)成可擴(kuò)展的可以處理大量的并發(fā)請(qǐng)求。
通過使用 HTTP 協(xié)議,RESTful API 可以輕松利用緩存、負(fù)載平衡和其他性能優(yōu)化技術(shù)。POSIX 是為本地文件系統(tǒng)訪問而開發(fā)的,在分布式或基于云的環(huán)境中不能很好地?cái)U(kuò)展——它太啰嗦了。
第三,RESTful API 提供了比 POSIX 更好的安全選項(xiàng)。
通過使用 TLS、OAuth 和 JSON Web Tokens 等現(xiàn)代安全協(xié)議,RESTful API 可以提供安全的身份驗(yàn)證、授權(quán)和數(shù)據(jù)加密。另一方面,POSIX 依賴于傳統(tǒng)的文件系統(tǒng)權(quán)限,這對(duì)于現(xiàn)代 Web 應(yīng)用程序來說很少是足夠的。
第五,RESTful API 被設(shè)計(jì)為獨(dú)立于平臺(tái)
可以從任何具有互聯(lián)網(wǎng)連接的設(shè)備進(jìn)行訪問。這使得開發(fā)跨不同平臺(tái)和操作系統(tǒng)的應(yīng)用程序變得更加容易。
最后,也許最重要的是,RESTful API 比 POSIX 更易于使用和開發(fā)。
借助 RESTful API,開發(fā)人員可以使用 GET、POST、PUT 和 DELETE 等簡單的 HTTP 動(dòng)詞與數(shù)據(jù)進(jìn)行交互。相比之下,POSIX 要求開發(fā)人員使用更復(fù)雜的系統(tǒng)調(diào)用和文件系統(tǒng)操作,這可能很難處理。隨著時(shí)間的推移,具有 POSIX 經(jīng)驗(yàn)的開發(fā)人員越來越少。
五、元數(shù)據(jù)驅(qū)動(dòng)
與基于文件的傳統(tǒng) SAN 和 NAS 解決方案不同,對(duì)象存儲(chǔ)是元數(shù)據(jù)驅(qū)動(dòng)的。這意味著每個(gè)對(duì)象都伴隨著一組描述它的元數(shù)據(jù)。此元數(shù)據(jù)可以包括對(duì)象的創(chuàng)建日期、文件類型或關(guān)鍵字等信息。
MinIO 的元數(shù)據(jù)原子方法是獨(dú)一無二的、超可擴(kuò)展的和超快速的。其他對(duì)象存儲(chǔ)供應(yīng)商并沒有在這方面投入精力,而是依靠第三方、集中式、元數(shù)據(jù)數(shù)據(jù)庫來處理工作。這是一個(gè)糟糕的選擇。
元數(shù)據(jù)驅(qū)動(dòng)的方法可以輕松地根據(jù)特定條件搜索和檢索對(duì)象。它甚至允許像S3 Select這樣的謂詞下推。例如,您可以輕松搜索某個(gè)時(shí)間段內(nèi)創(chuàng)建的所有對(duì)象或具有特定關(guān)鍵字的所有對(duì)象。要通過 SAN/NAS 實(shí)現(xiàn)這一點(diǎn),您需要一個(gè)專用的應(yīng)用程序?qū)印U缒赡芟胂蟮哪菢?,這催生了一個(gè)相當(dāng)健康的公司生態(tài)系統(tǒng),這些公司非常樂意對(duì)您的 SAN/NAS 征稅,以便讓它像 Web 應(yīng)用程序一樣工作。
總結(jié)
對(duì)象存儲(chǔ)始終是云中的主要存儲(chǔ)。隨著云操作模型的擴(kuò)展,對(duì)象存儲(chǔ)成為本地、托管和邊緣的主要存儲(chǔ)類型。原因有很多——從可擴(kuò)展性到安全性。用一家非常大的金融應(yīng)用程序公司的話來說,“我們將根據(jù)需要添加到我們現(xiàn)有的 SAN/NAS 足跡——但所有新事物都將進(jìn)入對(duì)象存儲(chǔ)。隨著時(shí)間的推移,那些遺留應(yīng)用程序和工作負(fù)載將被淘汰,我們甚至不會(huì)費(fèi)心對(duì)其進(jìn)行現(xiàn)代化改造,我們只會(huì)編寫云原生版本?!?/p>
我們每天都聽到。我們懷疑你也是。
本文由mdnice多平臺(tái)發(fā)布