如需將現(xiàn)存的集群安全且“平滑”地升級到更新的版本。
12.1 升級預(yù)檢
把正在對外提供服務(wù)的K8s集群升級比作“給飛行中的飛機換引擎”,所以升級的難度可想而知。
升級的難度主要有兩點:
- 1.集群經(jīng)過長時間的運行,積累了復(fù)雜的運行時狀態(tài).
- 2.集群已經(jīng)被進行了各種個性化配置。
這就需要在升級集群之前對集群進行全面的檢查,從而保證升級可以順利完成。集群升級預(yù)檢功能目前被放置在運維中心里。如下圖所示,運維中心支持集群升級前置檢查、組件升級前置檢查和集群檢查三種檢查類型。本章主要對集群升級前置檢查進行介紹與解析。
圖
12.1.1 核心組件檢查項
一個不健康的集群很可能會在升級中出現(xiàn)各種異常的問題,就算僥幸完成了升級,各種問題也會在后續(xù)使用中逐漸凸顯出來。
核心組件檢查項分為三類,分別是云資源檢查,核心組件檢查以及節(jié)點配置檢查。
1.集群云資源
容器服務(wù)K8s需要依賴阿里云底層的各種資源,集群所依賴的云資源一旦不健康,或發(fā)生配置錯誤,都會影響整個集群的狀態(tài)。
2.集群核心組件
集群核心組件的健康與否影響著整個集群的健康。下面我們就所需要檢查的組件、它們所包含的檢查項,以及檢查項異常可能帶來的影響進行分析,具體分析如下表所示。
表
3.集群節(jié)點配置
節(jié)點作為承載K8s的底層元計算資源,不僅