DBA(MySQL)學(xué)習(xí)-MHA高可用技術(shù)

1.準(zhǔn)備環(huán)境 看上節(jié)

1.1 配置關(guān)鍵程序軟連接

ln -s /application/mysql/bin/mysqlbinlog    /usr/bin/mysqlbinlog
ln -s /application/mysql/bin/mysql          /usr/bin/mysql

1.2 配置各節(jié)點(diǎn)互信

db01:
一條一條使用
rm -rf /root/.ssh 
ssh-keygen
cd /root/.ssh 
mv id_rsa.pub authorized_keys
scp  -r  /root/.ssh  10.0.0.52:/root 
scp  -r  /root/.ssh  10.0.0.53:/root

多節(jié)點(diǎn)驗(yàn)證:(每個(gè)語句單獨(dú)使用)
db01:

ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date

db02:
ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date

db03:
ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date

1.3 安裝軟件

下載mha軟件
mha官網(wǎng):https://code.google.com/archive/p/mysql-master-ha/
github下載地址:https://github.com/yoshinorim/mha4mysql-manager/wiki/Downloads
所有節(jié)點(diǎn)安裝Node軟件依賴包
yum install perl-DBD-MySQL -y
rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
在db01主庫中創(chuàng)建mha需要的用戶
 grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha';
Manager軟件安裝(db03)
yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
rpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm

1.4 配置文件準(zhǔn)備(db03)

創(chuàng)建配置文件目錄
 mkdir -p /etc/mha
創(chuàng)建日志目錄
 mkdir -p /var/log/mha/app1
編輯mha配置文件
cat > /etc/mha/app1.cnf<<EOF
[server default]
manager_log=/var/log/mha/app1/manager        
manager_workdir=/var/log/mha/app1            
master_binlog_dir=/data/binlog       
user=mha                                   
password=mha                               
ping_interval=2
repl_password=123
repl_user=repl
ssh_user=root                               
[server1]                                   
hostname=10.0.0.51
port=3306                                  
[server2]            
hostname=10.0.0.52
port=3306
[server3]
hostname=10.0.0.53
port=3306
EOF

每臺機(jī)器都修改一下hosts文件
[root@db01 ~]# cat /etc/hosts
127.0.0.1    localhost localhost.localdomain localhost4 localhost4.localdomain4
::1          localhost localhost.localdomain localhost6 localhost6.localdomain6
10.0.0.51 db01
[root@db02 ~]# cat /etc/hosts
127.0.0.1    localhost localhost.localdomain localhost4 localhost4.localdomain4
::1          localhost localhost.localdomain localhost6 localhost6.localdomain6
10.0.0.52 db02
[root@db03 ~]# cat /etc/hosts
127.0.0.1    localhost localhost.localdomain localhost4 localhost4.localdomain4
::1          localhost localhost.localdomain localhost6 localhost6.localdomain6
10.0.0.53 db03

1.5 狀態(tài)檢測(db03)

[root@db03 ~]# masterha_check_ssh  --conf=/etc/mha/app1.cnf 
Fri Jun 28 12:23:49 2019 - [debug]   ok.
Fri Jun 28 12:23:50 2019 - [info] All SSH connection tests passed successfully.  <<看這里
[root@db03 ~]# masterha_check_ssh  --conf=/etc/mha/app1.cnf 
MySQL Replication Health is OK.

1.6 開啟MHA(db03):

nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover  < /dev/null> /var/log/mha/app1/manager.log 2>&1 &

1.7 查看MHA狀態(tài)

[root@db03 ~]#  masterha_check_status --conf=/etc/mha/app1.cnf
app1 (pid:9068) is running(0:PING_OK), master:10.0.0.51
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.51 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 51    |
+---------------+-------+
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.52 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 52    |
+---------------+-------+
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.53 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 53    |
+---------------+-------+

2. 主從復(fù)制架構(gòu)演變

2.1 基礎(chǔ)主從()

1主1從
1主多從
多級主從
以上架構(gòu)大部分中小型企業(yè)中還在使用,還有一部分用了RDS
============================================================
雙主
中型企業(yè),在高可用(谷歌MMM),分布式架構(gòu)(Mycat,DBLE)
============================================================
環(huán)狀
多主1從
幾乎是沒人用
============================================================

2.2 高性能架構(gòu)-讀寫分離架構(gòu)

mysql-proxy    --->0.8 停了
360            --->二次開發(fā)Atlas 
MySQL          --->mysql-router
Percona        --->ProxySQL
Mariadb        ---> Maxscale

2.3 高可用架構(gòu)

2.3.1 企業(yè)高可用性標(biāo)準(zhǔn)(全年無故障率)

99.9%
99.99%
99.999%
99.9999%

2.3.2 高可用架構(gòu)產(chǎn)品

(1)負(fù)載均衡
LVS、F5、Nginx 有一定的高可用能力
(2)主備系統(tǒng)(單活)
KA、HA(roseHA,RHCS)、PowerHA、mc_sg、MHA、MMM  可以保證3個(gè)9到4個(gè)9
(3)多活系統(tǒng)
PXC(不收費(fèi))、MGC(不收費(fèi))、InnoDB Cluster(8.0,不收費(fèi))、
Oracle RAC(收費(fèi))、MySQL Cluster(收費(fèi))、Sysbase Cluster、DB2 Cluster

2.4 分布式架構(gòu)(現(xiàn)在的大趨勢)

Mycat 1.65版
DBLE

2.5 NewSQL

RDBMS+NoSQL+分布式
sp
TiDB
巨杉
PolarDB
OceanBase

3. MHA架構(gòu)模型

3.1 架構(gòu)圖

image.png

image.png
Manager
Node
一主兩從(三臺機(jī)器)

3.2 軟件結(jié)構(gòu)

(1)Manager
masterha_manger             啟動MHA 
masterha_check_ssh          檢查MHA的SSH配置狀況 
masterha_check_repl         檢查MySQL復(fù)制狀況 
masterha_master_monitor     檢測master是否宕機(jī) 
masterha_check_status       檢測當(dāng)前MHA運(yùn)行狀態(tài) 
masterha_master_switch      控制故障轉(zhuǎn)移(自動或者手動)
masterha_conf_host          添加或刪除配置的server信息
(2)Node
這些工具通常由MHA Manager的腳本觸發(fā),無需人為操作
save_binary_logs            保存和復(fù)制master的二進(jìn)制日志 
apply_diff_relay_logs       識別差異的中繼日志事件并將其差異的事件應(yīng)用于其他的
purge_relay_logs            清除中繼日志(不會阻塞SQL線程)

4. MHA工作過程

4.1 安裝過程說明

4.2 軟件工作過程(宕機(jī))

4.2.1 manager啟動

(1)讀取--conf=/etc/mha/app1.cnf
(2)獲取到MHA相關(guān)的信息(1主2從)
(3)調(diào)用masterha_check_ssh腳本,使用ssh_user=root進(jìn)行互信檢查,進(jìn)行互信檢查
(4)調(diào)用masterha_check_repl 檢查主從復(fù)制情況
(5)manager啟動成功
(6)通過masterha_master_monitor 以ping_interval=2 為間隔持續(xù)健康主句狀態(tài)
網(wǎng)絡(luò),主機(jī),數(shù)據(jù)庫恢復(fù)(mha)
(7)當(dāng)manager監(jiān)控到master宕機(jī)
(8)開始選主過程
     算法1:判斷是否有《強(qiáng)制主》參數(shù)
     算法2:判斷兩個(gè)從庫誰更新
     算法3:按照配置文件的書寫順序(從上往下)
(9)判斷主庫的SSH的連通性
     能:S1和S2立即保存(save_binary_logs)缺失部分的binlog到本地
     不能:
          在傳統(tǒng)模式下:調(diào)用apply_diff_relay_logs計(jì)算S1和S2的relay-log的差異需要通
[v內(nèi)容進(jìn)行復(fù)制的對比
          在GTID模式下:調(diào)用apply_diff_relay_logs計(jì)算S1和S2的relay-log的差異只需要對比GTID號碼即可,效率較好
最后進(jìn)行數(shù)據(jù)補(bǔ)償
(10)接觸S1從庫身份
(11)S2和S2構(gòu)建新的主從關(guān)系
(12)移除配置文件中故障節(jié)點(diǎn)
(13)manager工作完成,自殺。
額外的功能:
(1)提供Binlog server
(2)應(yīng)用透明(VIP)
(3)實(shí)時(shí)通知管理員(send_report)
(4)自愈系統(tǒng)(待開發(fā))

5. 故障模擬及處理

停主庫db01

/etc/init.d/mysqld.server stop
image.png

修復(fù)主庫

(1)啟動主庫
/etc/init.d/mysqld.server start
(2)恢復(fù)主從結(jié)構(gòu)
[root@db03 ~]# grep -i 'change master to ' /var/log/mha/app1/manager
Fri Jun 28 18:17:00 2019 - [info]  All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='10.0.0.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='xxx';
可以從db03從庫中找到'change master to'結(jié)構(gòu)

db01 [(none)]>CHANGE MASTER TO MASTER_HOST='10.0.0.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='123';
db01 [(none)]>start slave;
(3)修改配置文件(db03)
[root@db03 ~]# cat /etc/mha/app1.cnf 
[server default]
manager_log=/var/log/mha/app1/manager
manager_workdir=/var/log/mha/app1
master_binlog_dir=/data/binlog
password=mha
ping_interval=2
repl_password=123
repl_user=repl
ssh_user=root
user=mha
[server1]
hostname=10.0.0.51
port=3306

[server2]
hostname=10.0.0.52
port=3306

[server3]
hostname=10.0.0.53
port=3306
(4)啟動MHA(db03)

[root@db03 ~]# nohup masterha_manager --conf= /etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover  < /dev/null> /var/log/mha/app1/manager.log 2>&1 &
查看狀態(tài)[root@db03 ~]# masterha_check_status --conf=/etc/mha/app1.cnf

6. Manager 額外參數(shù)介紹

說明:
主庫宕機(jī)誰來接管呢?
1. 所有從節(jié)點(diǎn)日志都是一致的,默認(rèn)會以配置文件的順序去選擇一個(gè)新主。
2. 從節(jié)點(diǎn)日志不一致,自動選擇最接近于主庫的從庫
3. 如果對于某節(jié)點(diǎn)設(shè)定了權(quán)重(candidate_master=1),權(quán)重節(jié)點(diǎn)會優(yōu)先選擇。
但是此節(jié)點(diǎn)日志量落后主庫100M日志的話,也不會被選擇??梢耘浜蟘heck_repl_delay=0,關(guān)閉日志量的檢查,強(qiáng)制選擇候選節(jié)點(diǎn)。
(1)  ping_interval=1
#設(shè)置監(jiān)控主庫,發(fā)送ping包的時(shí)間間隔,嘗試三次沒有回應(yīng)的時(shí)候自動進(jìn)行failover
(2) candidate_master=1
#設(shè)置為候選master,如果設(shè)置該參數(shù)以后,發(fā)生主從切換以后將會將此從庫提升為主庫,即使這個(gè)主庫不是集群中事件最新的slave
(3)check_repl_delay=0
#默認(rèn)情況下如果一個(gè)slave落后master 100M的relay logs的話,
MHA將不會選擇該slave作為一個(gè)新的master,因?yàn)閷τ谶@個(gè)slave的恢復(fù)需要花費(fèi)很長時(shí)間,通過設(shè)置check_repl_delay=0,MHA觸發(fā)切換在選擇一個(gè)新的master的時(shí)候?qū)雎詮?fù)制延時(shí),這個(gè)參數(shù)對于設(shè)置了candidate_master=1的主機(jī)非常有用,因?yàn)檫@個(gè)候選主在切換的過程中一定是新的master

7. MHA的vip功能

參數(shù)

master_ip_failover_script=/usr/local/bin/master_ip_failover
注意:/usr/local/bin/master_ip_failover,必須事先準(zhǔn)備好

修改腳本內(nèi)容

vim  /usr/local/bin/master_ip_failover
my $vip = '10.0.0.55/24';
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig eth0:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig eth0:$key down";

更改manager配置文件:

vim /etc/mha/app1.cnf
添加:
master_ip_failover_script=/usr/local/bin/master_ip_failover
注意:
[root@db03 ~]# dos2unix /usr/local/bin/master_ip_failover 
dos2unix: converting file /usr/local/bin/master_ip_failover to Unix format ...
[root@db03 ~]# chmod +x /usr/local/bin/master_ip_failover 

主庫上,手工生成第一個(gè)vip地址

手工在主庫上綁定vip,注意一定要和配置文件中的ethN一致,我的是eth0:1(1是key指定的值)
ifconfig eth0:1 10.0.0.55/24      
注意:如果添加錯(cuò)了可通過 ifconfig eth0:1 down這個(gè)命令刪除掉
[root@db02 ~]# ifconfig 
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 10.0.0.52  netmask 255.255.255.0  broadcast 10.0.0.255
        inet6 fe80::20c:29ff:fea9:8a04  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:a9:8a:04  txqueuelen 1000  (Ethernet)
        RX packets 17984  bytes 6555546 (6.2 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 8794  bytes 1004168 (980.6 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

eth0:1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 10.0.0.55  netmask 255.255.255.0  broadcast 10.0.0.255
        ether 00:0c:29:a9:8a:04  txqueuelen 1000  (Ethernet)

重啟mha

masterha_stop --conf=/etc/mha/app1.cnf
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &

郵件提醒

1. 參數(shù):
report_script=/usr/local/bin/send
2. 準(zhǔn)備郵件腳本
send_report
(1)準(zhǔn)備發(fā)郵件的腳本(上傳 email_2019-最新.zip中的腳本,到/usr/local/bin/中)
(2)將準(zhǔn)備好的腳本添加到mha配置文件中,讓其調(diào)用

3. 修改manager配置文件,調(diào)用郵件腳本
vi /etc/mha/app1.cnf
report_script=/usr/local/bin/send

(3)停止MHA
masterha_stop --conf=/etc/mha/app1.cnf
(4)開啟MHA    
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
        
(5) 關(guān)閉主庫,看警告郵件  
故障修復(fù):
1. 恢復(fù)故障節(jié)點(diǎn)
(1)實(shí)例宕掉
/etc/init.d/mysqld start 
(2)主機(jī)損壞,有可能數(shù)據(jù)也損壞了
備份并恢復(fù)故障節(jié)點(diǎn)。
2.恢復(fù)主從環(huán)境
看日志文件:
[root@db03 /usr/local/bin]# grep -i 'change master to ' /var/log/mha/app1/manager
Fri Jun 28 20:25:47 2019 - [info]  All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='10.0.0.51', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='xxx';

start slave ;
3.恢復(fù)manager
3.1 修好的故障節(jié)點(diǎn)配置信息,加入到配置文件
[server1]
hostname=10.0.0.51
port=3306
3.2 啟動manager   
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容