作者:10pcm
鏈接:https://blog.51cto.com/superpcm/2095395
1. Keepalived高可用軟件
Keepalived軟件起初是專為LVS負(fù)載均衡軟件設(shè)計(jì)的,用來管理并監(jiān)控LVS集群系統(tǒng)中各個(gè)服務(wù)節(jié)點(diǎn)的狀態(tài),后來又加入了可以實(shí)現(xiàn)高可用的VRRP功能。因此,keepalived除了能夠管理LVS軟件外,還可以作為其他服務(wù)的高可用解決方案軟件。
keepalived軟件主要是通過VRRP協(xié)議實(shí)現(xiàn)高可用功能的。VRRP是Virtual Router Redundancy Protocol(虛擬路由冗余協(xié)議)的縮寫,VRRP出現(xiàn)的目的就是為了解決靜態(tài)路由的單點(diǎn)故障問題的,它能保證當(dāng)個(gè)別節(jié)點(diǎn)宕機(jī)時(shí),整個(gè)網(wǎng)絡(luò)可以不間斷地運(yùn)行。所以,keepalived一方面具有配置管理LVS的功能,同時(shí)還具有對LVS下面節(jié)點(diǎn)進(jìn)行健康檢查的功能,另一方面也可以實(shí)現(xiàn)系統(tǒng)網(wǎng)絡(luò)服務(wù)的高可用功能。
2. Keepalived高可用故障切換轉(zhuǎn)移原理
Keepalived高可用服務(wù)對之間的故障切換轉(zhuǎn)移,是通過VRRP來實(shí)現(xiàn)的。在keepalived服務(wù)工作時(shí),主Master節(jié)點(diǎn)會不斷地向備節(jié)點(diǎn)發(fā)送(多播的方式)心跳消息,用來告訴備Backup節(jié)點(diǎn)自己還活著。當(dāng)主節(jié)點(diǎn)發(fā)生故障時(shí),就無法發(fā)送心跳的消息了,備節(jié)點(diǎn)也因此無法繼續(xù)檢測到來自主節(jié)點(diǎn)的心跳了。于是就會調(diào)用自身的接管程序,接管主節(jié)點(diǎn)的IP資源和服務(wù)。當(dāng)主節(jié)點(diǎn)恢復(fù)時(shí),備節(jié)點(diǎn)又會釋放主節(jié)點(diǎn)故障時(shí)自身接管的IP資源和服務(wù),恢復(fù)到原來的備用角色。
3. Keepalived高可用實(shí)驗(yàn)環(huán)境說明
如下圖所示,前端有兩臺的Nginx負(fù)載均衡器,用來分發(fā)接收到客戶端的請求。在前文已經(jīng)配置好了Nginx01,Nginx02也是一樣的配置?,F(xiàn)在要在兩個(gè)Nginx負(fù)載均衡器上做高可用配置,Nginx01作為主節(jié)點(diǎn),Nginx02作為備節(jié)點(diǎn)。
4.安裝并啟用keepalived
keepalived的安裝非常簡單,直接使用yum來安裝即可。
yum install keepalived -y
安裝之后,啟動(dòng)keepalived服務(wù),順便把keepalived寫入開機(jī)啟動(dòng)的腳本里面去。。
/etc/init.d/keepalived star
echo "/etc/init.d/keepalived start" >>/etc/rc.local
啟動(dòng)之后會有三個(gè)進(jìn)程,沒問題之后可以關(guān)閉keepalived軟件,接下來要修改keepalived的配置文件。
5.修改keepalived配置文件并且重啟keepalived服務(wù)
/etc/init.d/keepalived stop #關(guān)閉keepalived服務(wù)
vim /etc/keepalived/keepalived.conf #用vim打開編輯
主節(jié)點(diǎn)的配置文件
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id lb01
}
vrrp_instance VI_1 {
state MASTER
interface eth1
virtual_router_id 55
priority 150
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.31.5/24 dev eth1 label eth1:1
}
}
......
備節(jié)點(diǎn)的配置文件
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id lb02
}
vrrp_instance VI_1 {
state BACKUP
interface eth1
virtual_router_id 55
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.31.5 dev eth1 label eth1:1
}
}
......
注解:修改配置文件主要就是上面加粗的幾個(gè)地方,下面說明一下那幾個(gè)參數(shù)的意思:
router_id 是路由標(biāo)識,在一個(gè)局域網(wǎng)里面應(yīng)該是唯一的;
vrrp_instance VI_1{…}這是一個(gè)VRRP實(shí)例,里面定義了keepalived的主備狀態(tài)、接口、優(yōu)先級、認(rèn)證和IP信息;
state 定義了VRRP的角色,interface定義使用的接口,這里我的服務(wù)器用的網(wǎng)卡都是eth1,根據(jù)實(shí)際來填寫,virtual_router_id是虛擬路由ID標(biāo)識,一組的keepalived配置中主備都是設(shè)置一致,priority是優(yōu)先級,數(shù)字越大,優(yōu)先級越大,auth_type是認(rèn)證方式,auth_pass是認(rèn)證的密碼
virtual_ipaddress {…}定義虛擬IP地址,可以配置多個(gè)IP地址,這里我定義為192.168.31.5,綁定了eth1的網(wǎng)絡(luò)接口,虛擬接口eth1:1
修改好主節(jié)點(diǎn)之后,保存退出,然后啟動(dòng)keepalived,幾分鐘內(nèi)會生成一個(gè)虛擬IP:192.168.31.5
然后修改備節(jié)點(diǎn)的配置文件,保存退出后啟動(dòng)keepalived,不會生成虛擬IP,如果生成那就是配置文件出現(xiàn)了錯(cuò)誤。備節(jié)點(diǎn)和主節(jié)點(diǎn)爭用IP資源,這個(gè)現(xiàn)象叫做“裂腦”。
6.進(jìn)行高可用的主備服務(wù)器切換實(shí)驗(yàn)
停掉主節(jié)點(diǎn)的keepalived服務(wù),查看備節(jié)點(diǎn)會不會生成VIP:192.168.31.5
啟動(dòng)主節(jié)點(diǎn)的keepalived服務(wù),然后查看主節(jié)點(diǎn)和備節(jié)點(diǎn)的VIP,主節(jié)點(diǎn)應(yīng)該會搶奪回來VIP:
7.搭配Nginx負(fù)載均衡來測試
修改windows的hosts文件,把域名指向到VIP上
然后用瀏覽器打開www.pcm.com的頁面,在web01上查看access.log日志記錄到的客戶端IP地址
可以看到日志記錄到的客戶端的IP地址是192.168.31.1,反向代理服務(wù)器是主服務(wù)器192.168.31.3.下面我們停止keepalived服務(wù),看備節(jié)點(diǎn)會不會接替主節(jié)點(diǎn)的VIP和服務(wù)。
可以看到,備節(jié)點(diǎn)確實(shí)接替了主節(jié)點(diǎn)的工作。重新啟用主節(jié)點(diǎn),實(shí)驗(yàn)的結(jié)果就不驗(yàn)證了。
8.編寫Nginx Web服務(wù)的守護(hù)腳本
上面的實(shí)驗(yàn)測試有一個(gè)問題就是,我們是用Nginx做負(fù)載均衡分發(fā)請求的數(shù)據(jù)包的。如果主節(jié)點(diǎn)的Keepalived服務(wù)正常運(yùn)行,而Nginx運(yùn)行異常,那么將會出現(xiàn)Nginx負(fù)載均衡服務(wù)失靈,無法切換到Nginx負(fù)載均衡器02上,后端的Web服務(wù)器無法收到請求。所以,我們應(yīng)該要檢測Nginx的服務(wù)是否正常運(yùn)行,如果不是正常運(yùn)行,應(yīng)該停掉Keepalived的服務(wù),這樣才能自動(dòng)切換到備節(jié)點(diǎn)上。
我們可以通過檢測80端口是否開啟來判定Nginx的運(yùn)行情況,2秒鐘檢測一次,腳本如下
#!/bin/bash
while true
do
if [ $(netstat -tlnp|grep nginx|wc -l) -ne 1 ]
then
/etc/init.d/keepalived stop
fi
sleep 2
done
實(shí)驗(yàn)的結(jié)果可以后臺執(zhí)行命令之后然后停止Nginx服務(wù)檢驗(yàn)