1:先來說一下為什么會(huì)出現(xiàn)這種方案,以及這個(gè)方案是怎么回事兒?
只要是個(gè)服務(wù),就都有掛的可能,Mysql也不例外,為了讓各位運(yùn)維、DBA、和全棧工程師晚上能睡個(gè)安穩(wěn)覺,有更多的時(shí)間和女朋友么么噠,我們希望數(shù)據(jù)庫服務(wù)器在宕機(jī)的時(shí)候能自動(dòng)恢復(fù)過來,最少的影響用戶的體驗(yàn),留下更多的獎(jiǎng)金買003。
這個(gè)時(shí)候我們的MHA(Mysql Highe Available)大顯身手了,他的原理就一句話:在Mysql的主從架構(gòu)下,當(dāng)主庫掛掉的時(shí)候,自動(dòng)將備庫升級(jí)為主庫,同時(shí)為其他備庫重新設(shè)置新的主庫。
假設(shè)我們有服務(wù)器
A:192.168.1.60 (主庫)
B:192.168.1.70(備庫,備主[主庫宕機(jī)的情況,提升B為主庫])
C:192.168.1.80(備庫2)
D: 192.168.1.88 (manager,MHA管理中心,安裝MHA manager,在主庫和備庫上面都需要安裝MHA node,manager管理node很好理解吧)
讓B C 成為A的slave 機(jī) 就不在這里介紹了,很簡(jiǎn)單的配置.
2:具體原理如下:
(1)從宕機(jī)崩潰的master保存二進(jìn)制日志事件(binlog events);
(2)識(shí)別含有最新更新的slave;
(3)應(yīng)用差異的中繼日志(relay log)到其他的slave;
(4)應(yīng)用從master保存的二進(jìn)制日志事件(binlog events);
(5)提升一個(gè)slave為新的master;
(6)使其他的slave連接新的master進(jìn)行復(fù)制;
3:MHA的安裝,因?yàn)镸HA的功能是通過perl腳本來實(shí)現(xiàn)的,所以我們要安裝perl環(huán)境
A: 讓A B C D四臺(tái)機(jī)子互相無密碼登陸
查看A B C D 主機(jī) /root/.ssh/ 下面有沒有 id_rsa.pub 文件
如果沒有從新生成 ssh-keygen -t rsa -b 2048
然后通過scp命令拷貝到其他三臺(tái)機(jī)子,如下
[root@192.168.1.88 ~]# scp id_rsa.pub root@192.168.1.60:/root/.ssh/ //復(fù)制到主機(jī)60
[root@192.168.1.60 ~]# cat id_rsa.pub >> authorized_keys
安裝必要的perl庫,
[root@192.168.1.88 ~]# yum install cpan perl
[root@192.168.1.88 ~]# yum -y install perl-MIME-Lite perl-Params-Validate perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
[root@192.168.1.88 ~]# wget ftp://ftp.muug.mb.ca/mirror/centos/6.5/os/x86_64/Packages/compat-db43-4.3.29-15.el6.x86_64.rpm
[root@192.168.1.88 ~]# wget http://downloads.naulinux.ru/pub/NauLinux/6x/i386/sites/School/RPMS/perl-Log-Dispatch-2.27-1.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Mail-Sender-0.8.16-3.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Mail-Sendmail-0.79-12.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://mirror.centos.org/centos/6/os/x86_64/Packages/perl-Time-HiRes-1.9721-136.el6.x86_64.rpm
[root@192.168.1.88 ~]# rpm -ivh perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm perl-Log-Dispatch-2.27-1.el6.noarch.rpm perl-Mail-Sender-0.8.16-3.el6.noarch.rpm perl-Mail-Sendmail-0.79-12.el6.noarch.rpm perl-Time-HiRes-1.9721-136.el6.x86_64.rpm
再安裝MHA manager(在192.168.1.88上)
[root@192.168.1.88 ~]# wget https://downloads.mariadb.com/files/MHA/mha4mysql-manager-0.55-0.el6.noarch.rpm
[root@192.168.1.88 ~]# rpm -ivh mha4mysql-manager-0.55-0.el6.noarch.rpm
安裝過程中會(huì)出現(xiàn)一些缺失的庫,自己再去找對(duì)應(yīng)的庫就好了;
再在從庫安裝MHA node(在192.168.1.50、192.168.1.60、192.168.1.70,A、B、C上)
[root@A-B-C ~]#wget https://downloads.mariadb.com/files/MHA/mha4mysql-node-0.54-0.el6.noarch.rpm
[root@A-B-C~]#rpm -ivh mha4mysql-node-0.54-0.el6.noarch.rpm
(缺失perl庫的話,按第一步來裝好)
配置Manager
shell> mkdir -p /masterha/app1 //創(chuàng)建app目錄,用來存放臨時(shí)數(shù)據(jù)文件,
shell> mkdir /etc/masterha //創(chuàng)建目錄,配置文件目錄
shell> vi /etc/masterha/app1.cnf //創(chuàng)建配置文件
[server default]
user=root //linux用于管理mysql用戶名
password=123456 //linux用于管理mysql密碼
manager_workdir=/masterha/app1
manager_log=/masterha/app1/manager.log
remote_workdir=/masterha/app1
ssh_user=root //ssh免密鑰登錄的帳號(hào)名
repl_user=slaver //mysql復(fù)制帳號(hào),用來在主從機(jī)之間同步二進(jìn)制日志等
repl_password=slaver //mysql密碼
ping_interval=1 //ping間隔,用來檢測(cè)master是否正常
[server2]
hostname=192.168.1.70
port=3306
[server3]
hostname=192.168.1.80
port=3306
設(shè)置relay log的清除方式(在每個(gè)slave節(jié)點(diǎn)上):
[root@192.168.0.80 ~]# mysql -e 'set global relay_log_purge=0'
[root@192.168.0.70 ~]# mysql -e 'set global relay_log_purge=0’
2、masterha_check_ssh工具驗(yàn)證ssh信任登錄是否成功
[root@192.168.0.88 ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf
注意:用ssh-keygen實(shí)現(xiàn)4臺(tái)主機(jī)之間相互免密鑰登錄決定這一步是否成功。
Wed Apr 23 22:10:01 2014 - [debug] ok.
Wed Apr 23 22:10:01 2014 - [info] All SSH connection tests passed successfully.
3、masterha_check_repl工具驗(yàn)證mysql復(fù)制是否成功
[root@192.168.0.88 ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf
注意:上一篇文章中的master--slaver是否成功決定這一步是否成功?;蚴荕HA文件配置的用戶賬號(hào)有關(guān)。
port=3306
candidate_master=1
master_binlog_dir=/data/mysql
[server1]
hostname=192.168.1.60
Wed Apr 23 22:10:56 2014 - [info] Checking replication health on 192.168.1.232..
Wed Apr 23 22:10:56 2014 - [info] ok.
Wed Apr 23 22:10:56 2014 - [warning] master_ip_failover_script is not defined.
Wed Apr 23 22:10:56 2014 - [warning] shutdown_script is not defined.
Wed Apr 23 22:10:56 2014 - [info] Got exit code 0 (Not master dead).
MySQL Replication Health is OK
在出庫上面停止mysql,模擬宕機(jī)的情況
[root@192.168.0.60 ~]#service mysql stop
我們可以在manager 機(jī)器上面看到輸出的日志
[root@192.168.0.88 ~]tail -f /masterha/app1/manager.log