目錄
- 一、MHA
- 1、概念
- 2、MHA 的組成
- 3、MHA 的特點(diǎn)
- 二、搭建MySQL+MHA
- 思路和準(zhǔn)備工作
- 1、關(guān)閉防火墻,檢測(cè)端口是否開(kāi)啟
- 2、修改mysql節(jié)點(diǎn)的主機(jī)名
- 3、修改三臺(tái)MySQL服務(wù)器的主配置文件/etc/my.cnf,并創(chuàng)建命令軟鏈接
- 4、配置MySQL一主兩從
- 5、安裝 MHA 軟件
- 6、在所有服務(wù)器上配置無(wú)密碼認(rèn)證
- 7、在 manager 節(jié)點(diǎn)上配置 MHA
- 8、第一次配置需要在 Master 節(jié)點(diǎn)上手動(dòng)開(kāi)啟虛擬IP
- 9、在 manager 節(jié)點(diǎn)上測(cè)試
- 10、查看相關(guān)狀態(tài)
- 三、故障模擬
一、MHA
1、概念
2、MHA 的組成
3、MHA 的特點(diǎn)
二、搭建MySQL+MHA
思路和準(zhǔn)備工作
1、MHA架構(gòu)
數(shù)據(jù)庫(kù)安裝
一主兩從
MHA搭建
2、故障模擬
模擬主庫(kù)失效
備選主庫(kù)成為主庫(kù)
原故障主庫(kù)恢復(fù)重新加入到MHA成為從庫(kù)
3、準(zhǔn)備4臺(tái)安裝MySQL虛擬機(jī)
MHA高可用集群相關(guān)軟件包
MHAmanager IP:192.168.221.30
MySQL1 IP:192.168.221.20
MySQL2 IP:192.168.221.100
MySQL3 IP: 192.168.221.110
1、關(guān)閉防火墻,檢測(cè)端口是否開(kāi)啟
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
netstat -natp | grep 3306
2、修改mysql節(jié)點(diǎn)的主機(jī)名
mysql1(192.168.221.20)
hostnamectl set-hostname mysql1
su -
hostnamectl set-hostname mysql2
su -
hostnamectl set-hostname mysql3
su -
3、修改三臺(tái)MySQL服務(wù)器的主配置文件/etc/my.cnf,并創(chuàng)建命令軟鏈接
MySQL1
vim /etc/my.cnf
[mysqld]
server-id = 1
log_bin = master-bin
log-slave-updates = true
systemctl restart mysqld
ln -s /usr/local/mysql/bin/mysql /usr/sbin/
ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/
MySQL2
vim /etc/my.cnf
server-id = 2
#server-id = 3 MySQL3則為3,三臺(tái)服務(wù)器 server-id 不能一樣
log_bin = master-bin
relay-log = relay-log-bin
relay-log-index = slave-relay-bin.index
systemctl restart mysqld
ln -s /usr/local/mysql/bin/mysql /usr/sbin/
ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/
4、配置MySQL一主兩從
(1)所有MySQL服務(wù)器進(jìn)行MySQL授權(quán)
mysql1(192.168.221.20)
mysql2(192.168.221.100)
mysql3(192.168.221.110)
3臺(tái)都要配置
mysql -uroot -p123
grant replication slave on *.* to 'myslave'@'192.168.221.%' identified by '123';
grant all privileges on *.* to 'mha'@'192.168.221.%' identified by 'manager';
grant all privileges on *.* to 'mha'@'mysql1' identified by 'manager';
grant all privileges on *.* to 'mha'@'mysql2' identified by 'manager';
grant all privileges on *.* to 'mha'@'mysql3' identified by 'manager';
flush privileges;
show master status;
(2)在 Slave1、Slave2 節(jié)點(diǎn)執(zhí)行同步操作
change master to master_host='192.168.221.20',master_user='myslave',master_password='123',master_log_file='master-bin.000005',master_log_pos=1991;
start slave;
show slave status\G
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
#一般 Slave_IO_Running: No 的可能性:
#網(wǎng)絡(luò)不通
#my.cnf配置有問(wèn)題
#密碼、file文件名、pos偏移量不對(duì)
#防火墻沒(méi)有關(guān)閉
(3)Slave1、Slave2 節(jié)點(diǎn)設(shè)置為只讀模式
mysql2(192.168.221.100)
mysql3(192.168.221.110)
set global read_only=1;
#改回讀寫狀態(tài)set global read_only=0;
(4)主從復(fù)制驗(yàn)證
mysql1(192.168.221.20)
創(chuàng)建庫(kù)
create database srs;
use test;
create table test(id int);
insert into test values(1);
mysql2(192.168.221.100)
mysql3(192.168.221.110)
查詢庫(kù)驗(yàn)證
show databases;
5、安裝 MHA 軟件
(1)所有服務(wù)器上都安裝 MHA 依賴的環(huán)境
MHAmanager(192.168.221.30)
mysql1(192.168.221.20)
mysql2(192.168.221.100)
mysql3(192.168.221.110)
首先安裝 epel 源,需要在線源安裝
再在所有服務(wù)器上安裝 node 組件
#安裝在線源
mv /etc/yum.repos.d/repos.bak/CentOS-* /etc/yum.repos.d/
yum list
yum install epel-release --nogpgcheck -y
yum install -y perl-DBD-MySQL \
perl-Config-Tiny \
perl-Log-Dispatch \
perl-Parallel-ForkManager \
perl-ExtUtils-CBuilder \
perl-ExtUtils-MakeMaker \
perl-CPAN
(2)所有服務(wù)器安裝MHA node軟件包
MHAmanager(192.168.221.30)
mysql1(192.168.221.20)
mysql2(192.168.221.100)
mysql3(192.168.221.110)
對(duì)于每個(gè)操作系統(tǒng)版本不一樣,這里 CentOS7.4 必須選擇 0.57 版本。
在所有服務(wù)器上必須先安裝 node 組件,最后在 MHA-manager 節(jié)點(diǎn)上安裝 manager 組件,因?yàn)?manager 依賴 node 組件。
#將軟件包mha4mysql-node-0.57.tar.gz放入/opt目錄下
cd /opt
tar zxvf mha4mysql-node-0.57.tar.gz
cd mha4mysql-node-0.57
perl Makefile.PL
make make install
在 MHA manager 節(jié)點(diǎn)上安裝 manager 組件
將軟件包mha4mysql-manager-0.57.tar.gz放入/opt目錄下
cd /opt
tar zxvf mha4mysql-manager-0.57.tar.gz
cd mha4mysql-manager-0.57
perl Makefile.PL
make make install
#node組件安裝后也會(huì)在/usr/local/bin 下面會(huì)生成幾個(gè)腳本(這些工具通常由 MHAManager 的腳本觸發(fā),無(wú)需人為操作)
#manager 組件安裝后在/usr/local/bin 下面會(huì)生成幾個(gè)工具
6、在所有服務(wù)器上配置無(wú)密碼認(rèn)證
(1)在 manager 節(jié)點(diǎn)上配置到所有數(shù)據(jù)庫(kù)節(jié)點(diǎn)的無(wú)密碼認(rèn)證
MHAmanager(192.168.221.30)
ssh-keygen -t rsa #一路按回車鍵
ssh-copy-id 192.168.221.20
ssh-copy-id 192.168.221.100
ssh-copy-id 192.168.221.110
(2)在 mysql1 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql2 和 mysql3 的無(wú)密碼認(rèn)證 ssh-keygen -t rsa
mysql1(192.168.221.20)
ssh-keygen -t rsa
ssh-copy-id 192.168.221.100
ssh-copy-id 192.168.221.110
(3)在 mysql2 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql1 和 mysql3 的無(wú)密碼認(rèn)證
mysql2(192.168.221.100)
ssh-keygen -t rsa
ssh-copy-id 192.168.221.20
ssh-copy-id 192.168.221.110
(4)在 mysql3 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql1 和 mysql2 的無(wú)密碼認(rèn)證
mysql3(192.168.221.110)
ssh-keygen -t rsa
ssh-copy-id 192.168.221.20
ssh-copy-id 192.168.221.100
篇幅太長(zhǎng)不予演示
7、在 manager 節(jié)點(diǎn)上配置 MHA
MHAmanager(192.168.221.30)
(1)在 manager 節(jié)點(diǎn)上復(fù)制相關(guān)腳本到/usr/local/bin 目錄
cp -rp /opt/mha4mysql-manager-0.57/samples/scripts /usr/local/bin
#復(fù)制后會(huì)有四個(gè)執(zhí)行文件
ll /usr/local/bin/scripts/
(2)復(fù)制上述的自動(dòng)切換時(shí) VIP 管理的腳本到 /usr/local/bin 目錄,這里使用master_ip_failover腳本來(lái)管理 VIP 和故障切換
cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin
#先清空原有內(nèi)容
echo '' > /usr/local/bin/master_ip_failover
#直接復(fù)制并修改vip相關(guān)參數(shù)
vim /usr/local/bin/master_ip_failover
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
#############################添加內(nèi)容部分#########################################
my $vip = '192.168.221.200'; #指定vip的地址
my $brdc = '192.168.221.255'; #指定vip的廣播地址
my $ifdev = 'ens33'; #指定vip綁定的網(wǎng)卡
my $key = '1'; #指定vip綁定的虛擬網(wǎng)卡序列號(hào)
my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; #代表此變量值為ifconfig ens33:1 192.168.221.200
my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; #代表此變量值為ifconfig ens33:1 down
my $exit_code = 0; #指定退出狀態(tài)碼為0
#my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;";
#my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key";
##################################################################################
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);
exit main();
sub main {
print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
if ( $command eq "stop" || $command eq "stopssh" ) {
my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
usage();
exit 1;
}
}
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
## A simple system call that disable the VIP on the old_master
sub stop_vip() {
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
mkdir /etc/masterha
cp /opt/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha
echo '' > /etc/masterha/app1.cnf
vim /etc/masterha/app1.cnf
[server default]
manager_log=/var/log/masterha/app1/manager.log
manager_workdir=/var/log/masterha/app1
master_binlog_dir=/usr/local/mysql/data
master_ip_failover_script=/usr/local/bin/master_ip_failover
master_ip_online_change_script=/usr/local/bin/master_ip_online_change
user=mha
password=manager
ping_interval=1
remote_workdir=/tmp
repl_user=myslave
repl_password=123
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.100 -s 192.168.221.110
shutdown_script=""
ssh_user=root
[server1]
hostname=192.168.221.20
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=192.168.221.100
port=3306
[server3]
hostname=192.168.221.110
port=3306
#--------------------------配置文件解釋--------------------------------------------------------------------------
[server default]
manager_log=/var/log/masterha/app1/manager.log #manager日志
manager_workdir=/var/log/masterha/app1.log #manager工作目錄
master_binlog_dir=/usr/local/mysql/data/ #master保存binlog的位置,這里的路徑要與master里配置的binlog的路徑一致,以便MHA能找到
master_ip_failover_script=/usr/local/bin/master_ip_failover #設(shè)置自動(dòng)failover時(shí)候的切換腳本,也就是上面的那個(gè)腳本
master_ip_online_change_script=/usr/local/bin/master_ip_online_change #設(shè)置手動(dòng)切換時(shí)候的切換腳本
user=mha #設(shè)置監(jiān)控用戶root
password=manager #設(shè)置mysql中root用戶的密碼,這個(gè)密碼是前文中創(chuàng)建監(jiān)控用戶的那個(gè)密碼
ping_interval=1 #設(shè)置監(jiān)控主庫(kù),發(fā)送ping包的時(shí)間間隔1秒,默認(rèn)是3秒,嘗試三次沒(méi)有回應(yīng)的時(shí)候自動(dòng)進(jìn)行failover
remote_workdir=/tmp #設(shè)置遠(yuǎn)端mysql在發(fā)生切換時(shí)binlog的保存位置
repl_user=myslave #設(shè)置復(fù)制用戶的用戶
repl_password=123 #設(shè)置復(fù)制用戶的密碼
report_script=/usr/local/send_report #設(shè)置發(fā)生切換后發(fā)送的報(bào)警的腳本
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.100 -s 192.168.221.110 #指定檢查的從服務(wù)器IP地址
shutdown_script="" #設(shè)置故障發(fā)生后關(guān)閉故障主機(jī)腳本(該腳本的主要作用是關(guān)閉主機(jī)防止發(fā)生腦裂,這里沒(méi)有使用)
ssh_user=root #設(shè)置ssh的登錄用戶名
[server1]
hostname=192.168.221.20
port=3306
[server2]
hostname=192.168.221.100
port=3306
candidate_master=1
#設(shè)置為候選master,設(shè)置該參數(shù)以后,發(fā)生主從切換以后將會(huì)將此從庫(kù)提升為主庫(kù),即使這個(gè)主庫(kù)不是集群中最新的slave
check_repl_delay=0
#默認(rèn)情況下如果一個(gè)slave落后master 超過(guò)100M的relay logs的話,MHA將不會(huì)選擇該slave作為一個(gè)新的master, 因?yàn)閷?duì)于這個(gè)slave的恢復(fù)需要花費(fèi)很長(zhǎng)時(shí)間;通過(guò)設(shè)置check_repl_delay=0,MHA觸發(fā)切換在選擇一個(gè)新的master的時(shí)候?qū)?huì)忽略復(fù)制延時(shí),這個(gè)參數(shù)對(duì)于設(shè)置了candidate_master=1的主機(jī)非常有用,因?yàn)檫@個(gè)候選主在切換的過(guò)程中一定是新的master
[server3]
hostname=192.168.221.110
port=3306
8、第一次配置需要在 Master 節(jié)點(diǎn)上手動(dòng)開(kāi)啟虛擬IP
Master(192.168.221.20)
/sbin/ifconfig ens33:1 192.168.221.200/24
9、在 manager 節(jié)點(diǎn)上測(cè)試
(1)在 manager 節(jié)點(diǎn)上測(cè)試 ssh 無(wú)密碼認(rèn)證
MHAmanager(192.168.221.30)
masterha_check_ssh -conf=/etc/masterha/app1.cnf
#如果正常最后會(huì)輸出 successfully;
#如果失敗可以去配置服務(wù)器無(wú)密碼認(rèn)證的地方看看有沒(méi)有問(wèn)題
(2)在 manager 節(jié)點(diǎn)上測(cè)試 mysql 主從連接情況
MHAmanager(192.168.221.30)
masterha_check_repl -conf=/etc/masterha/app1.cnf
#最后出現(xiàn) MySQL Replication Health is OK 字樣說(shuō)明正常;
#出現(xiàn)MySQL Replication Health is NOT OK!的,可以去看一下mysql服務(wù)器上的軟鏈接是否少創(chuàng)建-->本文位置:2、修改三臺(tái)MySQL服務(wù)器的主配置文件/etc/my.cnf,并創(chuàng)建命令軟鏈接
(3)在 manager 節(jié)點(diǎn)上啟動(dòng) MHA
MHAmanager(192.168.221.30)
nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover /dev/null > /var/log/masterha/app1/manager.log 2>1
#------------------------組件解釋----------------------------------------------------------------------------------
--remove_dead_master_conf:該參數(shù)代表當(dāng)發(fā)生主從切換后,老的主庫(kù)的 ip 將會(huì)從配置文件中移除。
--manger_log:日志存放位置。
--ignore_last_failover:在缺省情況下,如果 MHA 檢測(cè)到連續(xù)發(fā)生宕機(jī),且兩次宕機(jī)間隔不足 8 小時(shí)的話,則不會(huì)進(jìn)行 Failover, 之所以這樣限制是為了避免 ping-pong 效應(yīng)。該參數(shù)代表忽略上次 MHA 觸發(fā)切換產(chǎn)生的文件,默認(rèn)情況下,MHA 發(fā)生切換后會(huì)在日志記目錄,也就是上面設(shè)置的日志app1.failover.complete文件,下次再次切換的時(shí)候如果發(fā)現(xiàn)該目錄下存在該文件將不允許觸發(fā)切換,除非在第一次切換后收到刪除該文件,為了方便,這里設(shè)置為--ignore_last_failover。
10、查看相關(guān)狀態(tài)
MHAmanager(192.168.221.30)
查看 MHA 狀態(tài),可以看到當(dāng)前的 master 是 Mysql1 節(jié)點(diǎn)。
masterha_check_status --conf=/etc/masterha/app1.cnf
查看 MHA 日志,也以看到當(dāng)前的 master 是 192.168.221.20
cat /var/log/masterha/app1/manager.log | grep "current master"
查看 Mysql1 的 VIP 地址,查看 Mysql1 的 VIP 地址 192.168.163.200 是否存在,這個(gè) VIP 地址不會(huì)因?yàn)?manager 節(jié)點(diǎn)停止 MHA 服務(wù)而消失。
ifconfig
補(bǔ)充:若要關(guān)閉 manager 服務(wù),可以使用如下命令。
masterha_stop --conf=/etc/masterha/app1.cnf
或者可以直接采用 kill 進(jìn)程 ID 的方式關(guān)閉。
三、故障模擬
1、故障模擬
(1)在 manager 節(jié)點(diǎn)上監(jiān)控觀察日志記錄
MHAmanager(192.168.221.30)
tail -f /var/log/masterha/app1/manager.log
(2)在 Master 節(jié)點(diǎn) Mysql1 上停止mysql服務(wù)
mysql1(192.168.221.20)
systemctl stop mysqld
或
pkill -9 mysql
正常自動(dòng)切換一次后,MHA 進(jìn)程會(huì)退出。HMA 會(huì)自動(dòng)修改 app1.cnf 文件內(nèi)容,將宕機(jī)的 mysql1 節(jié)點(diǎn)刪除。
(3)查看 mysql2 是否接管 VIP
mysql2(192.168.221.100)
ifconfig
(4)回到manager 節(jié)點(diǎn)上監(jiān)控觀察日志記錄
tail -f /var/log/masterha/app1/manager.log
故障切換備選主庫(kù)的算法:
1、一般判斷從庫(kù)的是從(position/GTID)判斷優(yōu)劣,數(shù)據(jù)有差異,最接近于master的slave,成為備選主。
2、數(shù)據(jù)一致的情況下,按照配置文件順序,選擇備選主庫(kù)。
3、設(shè)定有權(quán)重(candidate_master=1),按照權(quán)重強(qiáng)制指定備選主。
(1)默認(rèn)情況下如果一個(gè)slave落后master 100M的relay logs的話,即使有權(quán)重,也會(huì)失效。
(2)如果check_repl_delay=0的話,即使落后很多日志,也強(qiáng)制選擇其為備選主。
2、故障修復(fù)
mysql1(192.168.221.20)
(1)修復(fù)master
systemctl restart mysqld
netstat -natp | grep 3306
mysql2(192.168.221.100)
(2)修復(fù)主從
在現(xiàn)主庫(kù)服務(wù)器 Mysql2查看二進(jìn)制文件和同步點(diǎn)
mysql -uroot -p123 -e 'show master status;'
#在數(shù)據(jù)庫(kù)中執(zhí)行show master status;
在原主庫(kù)服務(wù)器 mysql1 執(zhí)行同步操作
mysql1(192.168.221.20)
change master to master_host='192.168.221.100',master_user='myslave',master_password='123',master_log_file='master-bin.000001',master_log_pos=1747;
start slave;
show slave status\G
(3)在 manager 節(jié)點(diǎn)上修改配置文件app1.cnf
MHAmanager(192.168.221.30)
再把這個(gè)記錄添加進(jìn)去,因?yàn)樗鼨z測(cè)掉失效時(shí)候會(huì)自動(dòng)消失
vim /etc/masterha/app1.cnf
……
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.20 -s 192.168.221.110
......
[server1]
hostname=192.168.221.100
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=192.168.221.20
port=3306
[server3]
hostname=192.168.221.110
port=3306
(4)在 manager 節(jié)點(diǎn)上啟動(dòng) MHA
MHAmanager(192.168.221.30)
masterha_stop --conf=/etc/masterha/app1.cnf
nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover /dev/null > /var/log/masterha/app1/manager.log 2>1
masterha_check_status --conf=/etc/masterha/app1.cnf
到此這篇關(guān)于MySQL之高可用集群部署及故障切換實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)MySQL 高可用集群部署內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- MySQL之MHA高可用配置及故障切換實(shí)現(xiàn)詳細(xì)部署步驟
- MySQL數(shù)據(jù)庫(kù)實(shí)現(xiàn)MMM高可用群集架構(gòu)
- 基于mysql+mycat搭建穩(wěn)定高可用集群負(fù)載均衡主備復(fù)制讀寫分離操作
- Oracle和MySQL的高可用方案對(duì)比分析
- MySQL高可用解決方案MMM(mysql多主復(fù)制管理器)
- MySQL系列之十四 MySQL的高可用實(shí)現(xiàn)