Kubernetes架構(gòu)

Kubernets核心組件
- API Server
- Controller Manager
- Scheduler
- Kubelet
- Kube-Proxy
- Etcd
Kubernetes API Server原理解析
總體來看,Kubernetes API Server的核心功能是提供Kubernetes各類資源對象(如Pod、RC、Service等)的增、刪、改、查及Watch等HTTP Rest接口,成為集群內(nèi)各個功能模塊之間數(shù)據(jù)交互和通信的中心樞紐,是整個系統(tǒng)的數(shù)據(jù)總線和數(shù)據(jù)中心。除此之外,它還有以下一些功能特性。
(1)是集群管理的API入口。
(2)是資源配額控制的入口。
(3)提供了完備的集群安全機(jī)制。
API Server架構(gòu)

Controller Manager原理解析
Controller Manager內(nèi)部包含ReplicationController、Node Controller、ResourceQuotaController、Namespace Controller、ServiceAccountController、Token Controller、Service Controller及Endpoint Controller這8種Controller,每種Controller都負(fù)責(zé)一種特定資源的控制流程,而Controller Manager正是這些Controller的核心管理者。
Controller Manager架構(gòu)圖如下

Scheduler原理解析
Kubernetes Scheduler在整個系統(tǒng)中承擔(dān)了“承上啟下”的重要功能,“承上”是指它負(fù)責(zé)接收Controller Manager創(chuàng)建的新Pod,為其安排一個落腳的“家”——目標(biāo)Node;“啟下”是指安置工作完成后,目標(biāo)Node上的kubelet服務(wù)進(jìn)程接管后繼工作,負(fù)責(zé)Pod生命周期中的“下半生”。
具體來說,Kubernetes Scheduler的作用是將待調(diào)度的Pod(API新創(chuàng)建的Pod、Controller Manager為補足副本而創(chuàng)建的Pod等)按照特定的調(diào)度算法和調(diào)度策略綁定(Binding)到集群中某個合適的Node上,并將綁定信息寫入etcd中。在整個調(diào)度過程中涉及三個對象,分別是待調(diào)度Pod列表、可用Node列表,以及調(diào)度算法和策略。簡單地說,就是通過調(diào)度算法調(diào)度為待調(diào)度Pod列表中的每個Pod從Node列表中選擇一個最適合的Node。
隨后,目標(biāo)節(jié)點上的kubelet通過API Server監(jiān)聽到KubernetesScheduler產(chǎn)生的Pod綁定事件,然后獲取對應(yīng)的Pod清單,下載Image鏡像并啟動容器。
完整的流程圖如下:

Kubelet運行機(jī)制解析
在Kubernetes集群中,在每個Node(又稱Minion)上都會啟動一個kubelet服務(wù)進(jìn)程。該進(jìn)程用于處理Master下發(fā)到本節(jié)點的任務(wù),管理Pod及Pod中的容器。每個kubelet進(jìn)程都會在APIServer上注冊節(jié)點自身的信息,定期向Master匯報節(jié)點資源的使用情況,并通過cAdvisor監(jiān)控容器和節(jié)點資源。
Kube-proxy運行機(jī)制解析
起初,kube-proxy進(jìn)程是一個真實的TCP/UDP代理,類似HAProxy,負(fù)責(zé)從Service到Pod的訪問流量的轉(zhuǎn)發(fā),這種模式被稱為userspace(用戶空間代理)模式。當(dāng)某個Pod以Cluster IP方式訪問某個Service的時候,這個流量會被Pod所在本機(jī)的iptables轉(zhuǎn)發(fā)到本機(jī)的kube-proxy進(jìn)程,然后由kube-proxy建立起到后端Pod的TCP/UDP連接,隨后將請求轉(zhuǎn)發(fā)到某個后端Pod上,并在這個過程中實現(xiàn)負(fù)載均衡功能。
Kubernetes從1.2版本開始,將iptables作為kube-proxy的默認(rèn)模式。iptables模式下的kube-proxy不再起到Proxy的作用,其核心功能:通過API Server的Watch接口實時跟蹤Service與Endpoint的變更信息,并更新對應(yīng)的iptables規(guī)則,Client的請求流量則通過iptables的NAT機(jī)制“直接路由”到目標(biāo)Pod。

Kubernetes從1.8版本開始引入第3代的IPVS(IP Virtual Server)模式。IPVS在Kubernetes 1.11中升級為GA穩(wěn)定版。iptables與IPVS雖然都是基于Netfilter實現(xiàn)的,但因為定位不同,二者有著本質(zhì)的差別:iptables是為防火墻而設(shè)計的;IPVS則專門用于高性能負(fù)載均衡,并使用更高效的數(shù)據(jù)結(jié)構(gòu)(Hash表),允許幾乎無限的規(guī)模擴(kuò)張,因此被kube-proxy采納為第三代模式。

參考資料
Kubernetes權(quán)威指南:從Docker到Kubernetes實踐全接觸(第4版)龔正等