將應(yīng)用部署到 Kubernetes 時通常會使用 Deployment、Service、Ingress,整個應(yīng)用從部署到正常運(yùn)行,經(jīng)歷的流程很長。從 kubectl apply YAML 文件,經(jīng)過 apiserver、controller manager、scheduler、kubelet、以及 CRI、CNI 等眾多組件的協(xié)同工作。
漫長的“行程”,Pod 也經(jīng)歷各種正常和不正常的狀態(tài)變化,即使正常運(yùn)行也會出現(xiàn)服務(wù)無法訪問的問題。對于剛開始在 Kubernetes 平臺開展工作的同學(xué)來說,故障的排查確實(shí)棘手。之前工作的時候,經(jīng)常要協(xié)助排查各種問題。去年在 Learnk8s 上看到了關(guān)于 Deployment 故障排查的視圖,我還參考做了當(dāng)時整個平臺的故障排查視圖,包括了從項(xiàng)目源碼、CICD 流水線、部署整個流程的故障排查參考。
現(xiàn)在 Learnk8s 的 Deployment 排查指南更新了,也有了中文版本.
中文版PDF:https://learnk8s.io/a/a-visual-guide-on-troubleshooting-kubernetes-deployments/troubleshooting-kubernetes.zh_cn.v2.pdf

learnk8s.png