2019-07-30

存儲和成本管理

14.1數(shù)據(jù)壓縮

在分布式文件系統(tǒng)中,為了提高數(shù)據(jù)的可用性與性能,通常會將數(shù)據(jù)存儲3分,這就意味著存儲1TB的邏輯數(shù)據(jù),實際上會占用3TB的物理空間。

archive壓縮算法

14.2

數(shù)據(jù)重分布

14.4生命周期管理

1.周期性刪除策略

2.徹底刪除策略

3.永久保留策略

4.極限存儲策略

5.冷數(shù)據(jù)管理策略

冷數(shù)據(jù)管理是永久保留策略的擴展。永久保留的數(shù)據(jù)需要遷移到冷數(shù)據(jù)中心進行永久保存,同時將MaxCompute中對應的數(shù)據(jù)刪除。一般將重要且不可恢復的、占用存儲空間大于100TB,且訪問頻次較低的數(shù)據(jù)進行冷備,例如3年以上的日志數(shù)據(jù)。

6.增量表merge全量表策略

14.4.2

通用的生命周期管理矩陣

1.歷史數(shù)據(jù)等級劃分

P0:非常重要的主題域數(shù)據(jù)和非常重要的應用數(shù)據(jù),具有不可恢復性,如交易、日志、集團KPI數(shù)據(jù)、IPO關(guān)聯(lián)表。

P1:重要的業(yè)務數(shù)據(jù)和重要的應用數(shù)據(jù),具有不可恢復性,如重要的業(yè)務產(chǎn)品數(shù)據(jù)。

P2:重要的業(yè)務數(shù)據(jù)和重要的應用數(shù)據(jù),具有可恢復性,如重要的業(yè)務產(chǎn)品數(shù)據(jù)。

P3:不重要的業(yè)務數(shù)據(jù)和不重要的應用數(shù)據(jù),具有可恢復性,如某些SNS產(chǎn)品報表。

2.表類型劃分

(1)事件型流水表(增量表)

事件型流水表(增量表)指數(shù)據(jù)無重復或者無主鍵數(shù)據(jù),如日志。

(2)事件型鏡像表(增量表)

事件型鏡像表(增量表)指業(yè)務過程性數(shù)據(jù),有主鍵,但是對于同樣主鍵的屬性會發(fā)生緩慢變化,如交易、訂單狀態(tài)與時間會根據(jù)業(yè)務發(fā)生變更。

(3)維表

(4)merge全量表

(5)ETL臨時表

(6)TT臨時數(shù)據(jù)

(7)普通全量表

14.5數(shù)據(jù)成本計量

將一個數(shù)據(jù)表的成本分為存儲成本和計算成本。存儲成本是為了計量數(shù)據(jù)表消耗的存儲資源,計算成本是為了計量數(shù)據(jù)計算過程中的CPU消耗。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 區(qū)塊鏈數(shù)字貨幣資產(chǎn)之錢包 今天給大家介紹的是在加密領(lǐng)域和你切身相關(guān)的產(chǎn)品—錢包?,F(xiàn)實中錢包是放零錢的地方,更多的錢...
    領(lǐng)航者001閱讀 367評論 0 0
  • 陰天的夜里格外清冷,天空中無月無星,世界陷入一片漆黑之中,再也沒有比這更黑的夜色了,隨之而來的是一種更加深沉的安靜...
    范范子詩閱讀 281評論 0 4
  • 米粒檔案——真名米粒,網(wǎng)名也是米粒;年齡24歲;職業(yè)是廣告公司小設計;性格嘛,有點小執(zhí)著,有點小幻想;大學畢業(yè)二年...
    喵嗚姐姐閱讀 680評論 5 3
  • 陽春三月,常言春困的季節(jié)來到。 引起犯困的原因,大部分人第一時間會想到是睡眠不足。最常見的是提醒我們注意休息,保證...
    童學_02f2閱讀 658評論 0 2
  • 盎然公益微課群自從上周開始互動問題以來,有的群友留言說感覺自己像小學生,希望快快長大;有的群友感覺自己成長...
    幸運的老師閱讀 795評論 0 0

友情鏈接更多精彩內(nèi)容