結(jié)構(gòu)化數(shù)據(jù)如日期、電話號、賬戶余額、產(chǎn)品名稱等,嚴格遵循數(shù)據(jù)格式與長度規(guī)范、易于由二維表結(jié)構(gòu)進行邏輯表達和實現(xiàn),與之相反,非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整、缺乏預(yù)定義數(shù)據(jù)模型、格式多種多樣,比如文檔、圖片、音頻、視頻、社交媒體記錄等,往往呈現(xiàn)出雜亂無章的特點。
針對結(jié)構(gòu)化數(shù)據(jù),市面上有大量成熟的分析工具可用來實現(xiàn)數(shù)據(jù)洞察,但非結(jié)構(gòu)化數(shù)據(jù)難以標準化和理解,處理難度較大,對其價值挖掘尚處于發(fā)展階段。
關(guān)于非結(jié)構(gòu)化數(shù)據(jù)存儲,目前業(yè)內(nèi)主要有擅長存儲海量文件的NAS文件存儲和對象存儲兩種選項。
文件存儲
以文件和文件夾為操作對象,基于文件夾/文件的路徑訪問數(shù)據(jù)。這是一種比較接地氣的形式,我們?nèi)粘T陔娔X里先打開父文件夾,再層層點開父文件夾嵌套的子文件夾,最后找到子文件夾里的某個文件,這一套流程就是文件存儲的體驗。
作為數(shù)據(jù)存儲老手,文件存儲已經(jīng)被廣泛應(yīng)用十幾年,它能兼顧多個應(yīng)用和多個用戶訪問,突出優(yōu)勢是方便文件共享。
對象存儲
是近些年的存儲網(wǎng)紅,它以對象(object,不是搞對象的對象)為操作對象。不同于文件存儲的樹狀嵌套分層結(jié)構(gòu),對象存儲架構(gòu)更為扁平化,它將數(shù)據(jù)及其元數(shù)據(jù)打包放到一個超大的資源池,用戶可根據(jù)唯一的元數(shù)據(jù)快速定位文件。
有這么一個比喻,同樣到商場存包,文件存儲這個商場里,你要記住自己的物品放在哪間儲存室的哪排柜子的第幾號,而在對象存儲商場,存包員會給你一張憑條,你只需將憑條交給存包員即可取包,無需記住數(shù)據(jù)以什么形式存在了哪里。
對象存儲的靈活性和扁平架構(gòu)決定了它可以通過擴展來存儲海量數(shù)據(jù),其容量通??蛇_到EB級以上,從理論上講對象存儲的容量和對象數(shù)量可以無限擴充。
文件存儲還是對象存儲?
既然文件存儲和對象存儲的都適用于海量非結(jié)構(gòu)化數(shù)據(jù)存儲,那么用戶什么時候選擇文件存儲,什么時候選擇對象存儲呢?
有兩個主要指標,一看數(shù)據(jù)規(guī)模,二看應(yīng)用場景。
01 數(shù)據(jù)規(guī)模
文件存儲通過將數(shù)據(jù)劃分為類別、目錄和文件夾來獲取非結(jié)構(gòu)化數(shù)據(jù)并將其結(jié)構(gòu)化,由此用戶可以快速輕松地查詢搜索。
但是文件存儲中,一旦文件數(shù)達到數(shù)千萬級別,目錄樹越建越深,就會造成性能瓶頸,不僅查詢效率嚴重下降,而且超多超大文件管理困難,嚴重影響業(yè)務(wù)效率。
對于幾乎無形中可以添加更多空間、彈性擴容的對象存儲來說,爆炸性膨脹的非結(jié)構(gòu)化數(shù)據(jù)存儲簡直是小菜一碟。
因此,如果組織要處理的非結(jié)構(gòu)化數(shù)據(jù)量有限,文件存儲是最佳選擇。若組織需要處理大量數(shù)據(jù),那么選擇對象存儲是更明智的決定。
02 應(yīng)用場景
對象存儲之所以成為近些年的存儲頂流,除了其容量無限制、強擴展的特性,還在于其天然擁抱云和互聯(lián)網(wǎng)的特質(zhì)。
在對象存儲中,用戶若想修改文件,只能先下載、修改,再將修改后的文件上傳,這一特性決定了它非常適合讀取多寫入少的場景——比如網(wǎng)站視頻播放、網(wǎng)盤應(yīng)用、機器學(xué)習(xí)的數(shù)據(jù)訓(xùn)練、物聯(lián)網(wǎng)數(shù)據(jù)傳輸、云原生等,對于這些現(xiàn)代化應(yīng)用,對象存儲大有可為。
此外,對象存儲也被稱為云存儲,如今已成為云服務(wù)公司的一項基礎(chǔ)業(yè)務(wù),全球各知名廠商紛紛推出基于對象存儲的云存儲服務(wù),憑借其事實上的語言——AWS S3 API,對象存儲可以在內(nèi)部部署/私有云環(huán)境與公有云存儲之間進行無縫訪問和移動。
因此,對于人工智能、物聯(lián)網(wǎng)、云原生等新興應(yīng)用,對象存儲將是不錯的選擇。
————————————————
來源:https://blog.csdn.net/younger_china/article/details/127924452