news 2026/4/18 3:50:22

主备集群各参数分析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
主备集群各参数分析
  • 环境介绍

存在一个主备集群,在第三台服务器中配置了确认监视器及非确认监视器,其配置如下。

配置项

主机

备机

业务IP及内网

192.168.116.135

192.168.116.134

实例名

GRP1_RT_01

GRP1_RT_02

实例端口

5236

5236

MAL端口

5336

5336

MAL守护进程端口

5346

5346

守护进程端口

5556

5556

其dmwatcher.ini文件配置如下。

  • 验证参数

参数名

说明

DW_MODE

切换模式,缺省为 MANUAL

MANUAL:故障手动切换模式

AUTO:故障自动切换模式

INST_ERROR_TIME

数据库故障认定时间,单位秒,取值范围为 3~1800,缺省 15 秒没有收到数据库发送的状态信息,即认定其监控的数据库出现故障

INST_RECOVER_TIME

备库故障恢复检测时间间隔,单位秒,取值范围 3~86400,缺省每 60 秒检查一下备库状态,满足故障恢复条件时,启动历史数据同步流程。

数据守护系统启动完成后、Switchover 主备切换后、Takeover 备库接管后以及强制 Open 主库后,主库守护进程 INST_RECOVER_TIME 内存值会强制设置成 3,确保尽快启动数据同步。另外,还可以通过监视器命令 set recover time 修改 INST_RECOVER_TIME 内存值。

INST_AUTO_RESTART

是否自动重启数据库实例,0:不自动重启; 1:自动重启。缺省为 0

实验流程:

  1. 执行kill -9 命令,强行关闭GRP1_RT_01的实例,观察GRP1_RT_01守护进程、GRP1_RT_02守护进程、监视器的情况。

预期结果:

  1. 关闭GRP1_RT_01的实例后,GRP1_RT_01守护进程在20内秒中接收不到GRP1_RT_01实例的信息,认定GRP1_RT_01实例故障。20秒后自动拉起GRP1_RT_01实例并在60秒内检查该实例状态,若满足故障恢复条件,开始历史数据同步。
  2. 关闭GRP1_RT_01的实例后,GRP1_RT_02守护进程接收到GRP1_RT_01实例故障的信息并接收来自监视器的TAKEOVER命令,切换GRP1_RT_02实例为PRIMARY提供数据库服务。3、GRP1_RT_01实例自动拉起后,GRP1_RT_02发送归档日志至GRP1_RT_01实例开始数据同步。

实验截图:

①GRP1_RT_01守护进程日志截图:

18:23:47失去了与本地实例的连接。

18:23:50期间进行了多次检测,检测不到GRP1_RT_01实例,认定为该实例故障。

18:23:51不断接收到GRP1_RT_02守护进程的TAKEOVER信息,并完成主备切换。

18:24:07重启本地实例。

18:24:12设置守护进程为UNIFY EP状态,准备数据同步。

②GRP1_RT_02守护进程日志截图:

18:23:50.673接收到GRP1_RT_01实例故障的信息。

18:23:50.736接收到监视器的TAKEOVER命令,准备切换主备。

18:23:51完成主备切换。


18:24:14发送归档日志至GRP1_RT_01实例,开始数据恢复并很快完成了故障恢复。

实验结果:

  1. GRP1_RT_01守护进程在多次检测不到GRP1_RT_01实例的存在后,立即判断GRP1_RT_01实例故障。20秒后自动拉起GRP1_RT_01实例,并在5秒后开始数据同步。
  2. 关闭GRP1_RT_01实例后,GRP1_RT_02守护进程接收来自监视器的TAKEOVER命令完成主备切换。GRP1_RT_01实例被拉起后,发送归档日志至GRP1_RT_01实例开始数据同步。
  • 总结

本次实验中,该主备集群为自动切换模式,数据库故障认定时间为20秒,备份故障恢复检测时间间隔60秒,但在TAKEOVER命令切换后,会强制设置为3秒,守护进程会自动拉起本地实例。

在GRP1_RT_01实例被强制关闭后,GRP1_RT_01进程在多次检测不到GRP1_RT_01实例存在后,直接认定GRP1_RT_01实例故障,同时监视器向GRP1_RT_02进程发送TAKEOVER命令,切换GRP1_RT_02实例提供数据库服务。20秒后,GRP1_RT_01守护进程自动拉起GRP1_RT_01实例。5秒后,GRP1_RT_01实例接收GRP1_RT_02的归档日志,开始历史数据同步,此过程符合预期实验结果,也基本符合参数设置。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 8:02:10

一文说清STM32如何配置RS232通信参数

STM32串口通信实战:手把手教你搞定RS232参数配置 在调试板子时,你是否遇到过这样的场景?STM32的USART引脚明明接好了线,代码也“照着例程”写了一遍,结果PC端串口助手收到的却是一堆乱码—— …… 别急&#xff0c…

作者头像 李华
网站建设 2026/4/18 5:28:18

无显示器环境下树莓派系统烧录深度剖析

无显示器环境下树莓派系统烧录实战指南:从零开始实现“开箱即控”你有没有遇到过这样的场景?手头有十几块树莓派要部署到不同地点,现场没有显示器、键盘,甚至连网线都没有——只有一台笔记本和一堆MicroSD卡。这时候,传…

作者头像 李华
网站建设 2026/4/17 0:31:53

HTML Canvas动画演示PyTorch反向传播过程通俗易懂

HTML Canvas动画演示PyTorch反向传播过程通俗易懂 在深度学习的教学现场,一个常见的场景是:学生盯着黑板上的链式求导公式皱眉良久,最终小声问:“所以……这个梯度到底是怎么一层层传回去的?” 这正是反向传播&#…

作者头像 李华
网站建设 2026/4/18 7:54:40

华为帧中继配置

一、动态映射二、帧中继配置1、动态映射R1&#xff1a;<Huawei>sys Enter system view, return user view with CtrlZ. [Huawei]undo info-center ena Info: Information center is disabled. [Huawei]sysn R1 [R1]int s1/0/0 [R1-Serial1/0/0]link-protocol fr Warning:…

作者头像 李华
网站建设 2026/4/18 7:56:40

Miniconda-Python3.11镜像如何提升你的AI实验复现效率

Miniconda-Python3.11镜像如何提升你的AI实验复现效率 在深度学习实验室里&#xff0c;你是否经历过这样的场景&#xff1a;论文代码跑不起来&#xff0c;报错信息指向某个找不到的CUDA版本&#xff1b;同事说“在我机器上明明能运行”&#xff1b;新成员入职三天还在装环境………

作者头像 李华
网站建设 2026/4/18 7:55:03

解决PyTorch版本不兼容问题:使用Miniconda建立干净环境

解决PyTorch版本不兼容问题&#xff1a;使用Miniconda建立干净环境 在深度学习项目开发中&#xff0c;你是否曾遇到这样的场景&#xff1f;刚克隆一个开源模型仓库&#xff0c;兴冲冲地运行 pip install -r requirements.txt&#xff0c;结果报错&#xff1a;torch.cuda.is_av…

作者头像 李华