AWS架構(gòu)完善框架的五大支柱

前言

  • 寫一個軟件系統(tǒng)和建筑工程很類似,如果基礎(chǔ)不牢固,結(jié)構(gòu)性問題會暗中侵蝕建筑物的功能和完整性
  • 基于AWS設(shè)計技術(shù)解決方案時,如果忽視卓越操作、安全性、可靠性、性能效率和成本優(yōu)化這五大支柱,交付一個能滿足你需求期望的系統(tǒng)可能就比較困難
  • 如果把這五大支柱納入架構(gòu)設(shè)計時的考量范圍,能夠幫助我們構(gòu)建穩(wěn)定、高效的軟件系統(tǒng),從而有更多的精力投入其他方面的工作,例如業(yè)務(wù)功能需求

什么是AWS Well-Architected Framework?

AWS Well-Architected Framework可幫助云架構(gòu)師為其應(yīng)用程序構(gòu)建安全、高性能、具有彈性和高效的基礎(chǔ)設(shè)施?;诎踩浴⒖煽啃?、性能效率、成本優(yōu)化和卓越操作這五個基礎(chǔ)支柱,此框架為客戶和合作伙伴提供了一種評估架構(gòu)的一致方法,并實施能夠在使用中擴展的設(shè)計。

五大支柱概覽

卓越操作

定義

卓越操作支柱側(cè)重于運行和監(jiān)測系統(tǒng)以提供業(yè)務(wù)價值,并不斷改進流程和程序。關(guān)鍵主題包括:管理和自動化變更、響應(yīng)事件以及定義標準以成功管理日常操作。

白皮書

https://d1.awsstatic-china.com/whitepapers/architecture/AWS-Operational-Excellence-Pillar.pdf

設(shè)計原則

  • 使用代碼進行操作
  • 為文檔做注釋
  • 用高頻率、單一變更內(nèi)容(小)、可回退的變更替代大批量的變更
  • 持續(xù)改進變更流程
  • 預(yù)見錯誤的發(fā)生
  • 從所有操作錯誤中學(xué)習(xí)

最佳實踐

  • 運維人員需要理解業(yè)務(wù)和客戶需求才能正確支撐業(yè)務(wù)
  • 運維人員創(chuàng)建操作流程并在實踐中檢驗流程是否有效支持業(yè)務(wù)需要
  • 運維人員需要通過采集指標來衡量業(yè)務(wù)需要是否達到要求,得到滿足
  • 業(yè)務(wù)場景、業(yè)務(wù)優(yōu)先級、客戶需求會不斷發(fā)生變化,在變化來臨是,需要能夠及時調(diào)整操作流程以適應(yīng)改變

安全性

定義

安全支柱側(cè)重于保護信息和系統(tǒng)。關(guān)鍵主題包括:數(shù)據(jù)的機密性和完整性、識別和管理誰可以進行哪些權(quán)限管理工作、保護系統(tǒng)以及建立檢測安全事件的控制措施。

白皮書

https://d1.awsstatic-china.com/whitepapers/architecture/AWS-Security-Pillar.pdf

設(shè)計原則

  • 強身份認證作為基礎(chǔ)
  • 使系統(tǒng)具備可追溯能力
  • 在不同層級上確保安全性
  • 自動化安全性最佳實踐
  • 靜止的和傳輸中的數(shù)據(jù)都要保護
  • 提前為安全事故做好準備

最佳實踐

  • 在設(shè)計系統(tǒng)之前,考慮誰可以使用它?怎么識別安全事故?如何保障數(shù)據(jù)的完整性和可靠性?
  • 需要指定詳細的并且經(jīng)過實踐驗證的安全事故響應(yīng)流程,這對于減少商業(yè)損失和遵循監(jiān)管意義重大
  • 定義AWS責任共擔模型,AWS與客戶分別承擔相應(yīng)的責任

可靠性

定義

可靠性支柱側(cè)重于預(yù)防故障、快速從故障中恢復(fù)根據(jù)業(yè)務(wù)量動態(tài)調(diào)整資源以滿足業(yè)務(wù)和客戶需求的能力。關(guān)鍵主題包括:設(shè)置相關(guān)的基本要素、跨項目要求、恢復(fù)計劃以及我們?nèi)绾翁幚碜兏?/p>

白皮書

https://d1.awsstatic-china.com/whitepapers/architecture/AWS-Reliability-Pillar.pdf

設(shè)計原則

  • 測試故障恢復(fù)流程,演練異?;謴?fù)方案
  • 自動從異常中恢復(fù)
  • 通過水平擴展提升服務(wù)整體可用性
  • 停止猜測系統(tǒng)能力
  • 通過自動化管理變更

最佳實踐

  • 可靠性的達成,要求對系統(tǒng)各個方面進行監(jiān)控、配置相應(yīng)的告警策略、管控變更、能夠從錯誤中自愈
  • 考慮基礎(chǔ)底座的可靠性,例如網(wǎng)絡(luò)帶寬

性能效率

定義

性能效率支柱側(cè)重于高效使用 IT 和計算資源。關(guān)鍵主題包括:根據(jù)工作負載要求選擇合適的資源類型和大小、監(jiān)測性能以及做出明智的決策以在業(yè)務(wù)需求發(fā)展或技術(shù)革新時維持效率。

白皮書

https://d1.awsstatic-china.com/whitepapers/architecture/AWS-Performance-Efficiency-Pillar.pdf

設(shè)計原則

  • 廣泛采用先進技術(shù)
  • 全球范圍分鐘級可達
  • 使用無服務(wù)器架構(gòu)
  • 頻繁進行實驗
  • 理解機器?

最佳實踐

  • 數(shù)據(jù)驅(qū)動,收集各個方面的數(shù)據(jù),從高層次的設(shè)計層面決定資源的規(guī)格
  • 通過監(jiān)控發(fā)現(xiàn)性能效率異常以及時采取行動,循環(huán)檢視確保在云化過程中活得了收益
  • 根據(jù)業(yè)務(wù)場景需求,適當權(quán)衡取舍,比如壓縮或緩存、降低一致性要求優(yōu)化性能

成本優(yōu)化

定義

成本優(yōu)化側(cè)重于避免不必要的成本。關(guān)鍵主題包括:了解和控制資金的使用、選擇最合適的資源類型和數(shù)量、分析一段時間內(nèi)的支出以及擴展以滿足業(yè)務(wù)需求而不超支。

白皮書

https://d1.awsstatic-china.com/whitepapers/architecture/AWS-Cost-Optimization-Pillar.pdf

設(shè)計原則

  • 確定一個消費模型
  • 度量整體的效率
  • 停止在數(shù)據(jù)中心操作上支出
  • 分析分類支出
  • 相對于完全擁有服務(wù)的所有權(quán),使用代理管理的服務(wù)以減少支出

最佳實踐

  • 成本也是需要權(quán)衡的,比如需要快速上線,過點、交付市場,提供新特性,把成本先放一放也不是不可以
  • 違背了經(jīng)驗數(shù)據(jù)進行設(shè)計決策,總是想著以防萬一,可能會導(dǎo)致極大的資源浪費增加不必要的開銷
  • 選擇合適規(guī)格的資源實例是成本控制的鑰匙,比如一個業(yè)務(wù)程序在小規(guī)格實例上需要跑5個小時,而在大規(guī)格的實例上只需要跑1個小時,哪一種才是最高效的?

總結(jié)

AWS Well-Architected Framework提供了架構(gòu)完善的五大支柱以及最佳實踐,幫助我們基于AWS設(shè)計和操作可靠、安全、性能成本高效的系統(tǒng),從而有更多的精力投入其他方面的工作,例如業(yè)務(wù)功能需求。

More

卓越操作與可靠性,卓越操作其實是為了降低運維過程中犯錯的可能,或縮短因犯錯導(dǎo)致系統(tǒng)不可用的時長,從運維層面保障了系統(tǒng)的可靠性。AWS架構(gòu)完善五大支柱中的卓越操作與可靠性相關(guān)的設(shè)計原則和最佳實踐與Google的SRE中的許多思想(如監(jiān)控系統(tǒng)、變更管理、制定服務(wù)質(zhì)量目標等)是一致的。

安全性,作為一名開發(fā)人員,曾經(jīng)被測試提出不少安全問題,類別五花八門:有橫向縱向越權(quán)問題、存儲/打印用戶敏感信息、文件目錄權(quán)限過大、系統(tǒng)使用弱密碼、使用root權(quán)限啟動業(yè)務(wù)進程,引入帶有漏洞或存在法務(wù)風(fēng)險的第三方軟件等。系統(tǒng)的安全性是重中之重,在實際工作中,我們通過安全設(shè)計、安全編碼以及安全測試保障系統(tǒng)的安全性達到要求、符合地方法規(guī)。

參考鏈接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容