MySQL 高可用集群搭建部署

MySQL 高可用集群搭建(GTID 模式 + 自动故障转移)


一、环境规划

角色

IP 地址

说明

主库 (Master)

192.168.1.100

运行 MySQL + Keepalived/MHA

从库1 (Slave1)

192.168.1.101

运行 MySQL + Keepalived/MHA

从库2 (Slave2)

192.168.1.102

运行 MySQL

虚拟 IP (VIP)

192.168.1.200

客户端访问入口


二、配置 GTID 主从同步

1. 所有节点配置 MySQL

# 编辑配置文件(MySQL 8.0)

sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf

 

[mysqld]

# 通用配置

server-id = 1                 # 主库设为 1,从库依次递增(2, 3...)

log_bin = /var/log/mysql/mysql-bin.log

binlog_format = ROW

expire_logs_days = 7

# GTID 配置

gtid_mode = ON                # 启用 GTID

enforce_gtid_consistency = ON # 强制 GTID 一致性

log_slave_updates = ON        # 从库记录 binlog(级联复制必需)

 

# 重启 MySQL

sudo systemctl restart mysql

2. 主库操作

-- 创建复制专用用户

CREATE USER 'repl'@'192.168.1.%' IDENTIFIED BY 'SecurePass123!';

GRANT REPLICATION SLAVE ON *.* TO 'repl'@'192.168.1.%';

FLUSH PRIVILEGES;

 

-- 查看 GTID 状态

SHOW MASTER STATUS\G

-- 输出示例:

-- File: mysql-bin.000001

-- Position: 154

-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5

3. 从库操作

-- 配置主库信息(所有从库执行)

CHANGE MASTER TO

MASTER_HOST = '192.168.1.100',

MASTER_USER = 'repl',

MASTER_PASSWORD = 'SecurePass123!',

MASTER_AUTO_POSITION = 1;  -- GTID 模式自动同步位置

 

-- 启动复制

START SLAVE;

 

-- 检查复制状态

SHOW SLAVE STATUS\G

-- 关键指标:

-- Slave_IO_Running: Yes

-- Slave_SQL_Running: Yes

-- Retrieved_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5

-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5


三、自动故障转移方案


方案 1:Keepalived + VIP(快速切换)

1. 安装 Keepalived(主库和从库1)

# Ubuntu/Debian

sudo apt install keepalived

# CentOS/RHEL

sudo yum install keepalived

2. 主库 Keepalived 配置

sudo vim /etc/keepalived/keepalived.conf

 

vrrp_script chk_mysql {

  script "/usr/bin/pgrep mysqld"  # 检查 MySQL 进程

  interval 2

  weight 2

}

 

vrrp_instance VI_1 {

  state MASTER

  interface eth0

  virtual_router_id 51

  priority 100                   # 主库优先级更高

  advert_int 1

  authentication {

    auth_type PASS

    auth_pass 1234

  }

  virtual_ipaddress {

    192.168.1.200/24            # 虚拟 IP

  }

  track_script {

    chk_mysql

  }

}

3. 从库 Keepalived 配置

sudo vim /etc/keepalived/keepalived.conf

 

vrrp_instance VI_1 {

  state BACKUP

  interface eth0

  virtual_router_id 51

  priority 50                    # 优先级低于主库

  advert_int 1

  authentication {

    auth_type PASS

    auth_pass 1234

  }

  virtual_ipaddress {

    192.168.1.200/24

  }

  track_script {

    chk_mysql

  }

}

4. 启动并验证

sudo systemctl restart keepalived

sudo systemctl enable keepalived

 

# 检查 VIP 绑定

ip addr show eth0 | grep 192.168.1.200


方案 2:MHA(智能故障转移)

1. 所有节点配置 SSH 免密登录

# 在 MHA Manager 节点执行

ssh-keygen -t rsa

ssh-copy-id root@192.168.1.100

ssh-copy-id root@192.168.1.101

ssh-copy-id root@192.168.1.102

2. 安装 MHA Node(所有 MySQL 节点)

# Ubuntu/Debian

sudo apt install mha4mysql-node

 

# CentOS/RHEL

sudo yum install https://github.com/yoshinorim/mha4mysql-node/releases/download/v0.58/mha4mysql-node-0.58-0.el7.noarch.rpm

3. 安装 MHA Manager(管理节点)

# Ubuntu/Debian

sudo apt install mha4mysql-manager

 

# CentOS/RHEL

sudo yum install https://github.com/yoshinorim/mha4mysql-manager/releases/download/v0.58/mha4mysql-manager-0.58-0.el7.noarch.rpm

4. 配置 MHA

sudo mkdir -p /etc/mha

sudo vim /etc/mha/app1.cnf

 

[server default]

manager_workdir=/var/log/mha/app1

manager_log=/var/log/mha/app1/manager.log

ssh_user=root

repl_user=repl

repl_password=SecurePass123!

ping_interval=3

 

[server1]

hostname=192.168.1.100

candidate_master=1

 

[server2]

hostname=192.168.1.101

candidate_master=1

 

[server3]

hostname=192.168.1.102

5. 启动 MHA

masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover

 

# 检查状态

masterha_check_status --conf=/etc/mha/app1.cnf


四、数据备份与恢复(GTID 模式)

1. 全量备份

# 使用 mysqldump(主库执行)

mysqldump -u root -p --all-databases --single-transaction --set-gtid-purged=ON > full_backup_$(date +%Y%m%d).sql

2. 增量备份

-- 定期记录 GTID 集合

SHOW GLOBAL VARIABLES LIKE 'gtid_executed';

-- 示例输出:3E11FA47-71CA-11E1-9E33-C80AA9429562:1-1000

 

-- 增量备份时导出新增 GTID 区间

mysqlbinlog --include-gtids='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001-2000' /var/log/mysql/mysql-bin.00000* > incremental_backup.sql

3. 数据恢复

# 全量恢复

mysql -u root -p < full_backup_20231001.sql

 

# 增量恢复

mysql -u root -p < incremental_backup.sql


五、主从切换操作

1. 手动切换(GTID 模式)

-- 在目标从库执行

STOP SLAVE;

RESET SLAVE ALL;

 

-- 提升为新主库

SET GLOBAL read_only = OFF;

 

-- 其他从库指向新主库

CHANGE MASTER TO

MASTER_HOST='192.168.1.101',

MASTER_USER='repl',

MASTER_PASSWORD='SecurePass123!',

MASTER_AUTO_POSITION=1;

START SLAVE;


六、验证与监控

1. 检查 GTID 一致性

-- 所有节点执行

SHOW GLOBAL VARIABLES LIKE 'gtid_executed';

-- 确保所有节点 GTID 集合相同

2. 监控复制延迟

SHOW SLAVE STATUS\G

-- 关注 Seconds_Behind_Master

3. 日志检查

# Keepalived 日志

journalctl -u keepalived

 

# MHA 日志

tail -f /var/log/mha/app1/manager.log


七、故障排查命令

1. 主从复制中断

-- 查看错误原因

SHOW SLAVE STATUS\G

 

-- 跳过错误(谨慎操作)

STOP SLAVE;

SET GTID_NEXT='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001';

BEGIN; COMMIT;

SET GTID_NEXT='AUTOMATIC';

START SLAVE;

2. VIP 未漂移

# 检查 Keepalived 进程

ps aux | grep keepalived

 

# 手动释放 VIP

systemctl restart keepalived


八、关键注意事项

  1. GTID 限制
  • 禁止直接修改 gtid_purged,可能导致数据冲突。
  • 所有事务必须通过 GTID 复制,禁用非 GTID 操作(如 CHANGE MASTER TO MASTER_LOG_FILE)。
  • 备份策略
    • 全量备份每日一次,增量备份每小时一次。
    • 使用 Percona XtraBackup 替代 mysqldump 支持热备份:

    xtrabackup --backup --target-dir=/backup/xtrabackup/full

    1. 安全加固
    • 限制复制用户 IP 范围(如 repl'@'192.168.1.%')。
    • 加密备份文件并存储到远程服务器。

    通过以上步骤,您将获得一个基于 GTID + Keepalived/MHA 的高可用 MySQL 集群,支持自动故障转移、数据一致性保障和快速恢复。

    作者:Johny_Zhao原文地址:https://www.cnblogs.com/Johny-zhao/p/18847876

    %s 个评论

    要回复文章请先登录注册