大数据-之LibrA数据库系统告警处理(ALM-37003 GTM主备不同步或者GTM主备断连)
告警解释
当GTM主实例与GTM备实例连接异常或者GTM主实例未处于同步状态时,产生该告警。
告警属性
告警ID | 告警级别 | 可自动清除 |
---|---|---|
37003 | 严重 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
ServiceName | 产生告警的服务名称 |
RoleName | 产生告警的角色名称 |
HostName | 产生告警的主机名 |
Instance | 产生告警的实例 |
对系统的影响
当GTM主实例与GTM备实例连接异常时,如果GTM主实例处于同步模式,系统将在120s内不可用,待检测到该故障时,会将GTM主实例设成最高可用模式,系统恢复使用。如果是最高可用模式,系统仍然可以正常使用。
说明:
集群正常运行时,GTM主实例处于同步模式,主实例收到执行任务后会同步任务到备实例,主备实例间实时同步。当备实例故障且无法自动修复后,主实例将停止同步任务到备实例,此时称主实例为最高可用模式。
可能原因
GTM主实例与GTM备实例连接异常。
处理步骤
查看告警原因。
- 执行如下命令查看集群GTM主备实例是否故障。
gs_om -t status --detail
- 是,修复故障实例,具体方法请参考“修复MPPDBServer实例”章节。
- 否,执行2。
- 查看集群GTM主备实例所在机器网络是否正常,比如GTM主实例所在机器或者备实例所在机器机使用的网卡为eth0,使用下面命令查看网络是否正常。
/sbin/ifconfig eth0
- 如果网卡正常,执行3。
- 如果显示网卡不正常,请及时联系硬件工程师修复网卡,再执行3。
- 查看告警是否仍然存在。
- 是,执行4。
- 否,处理完毕。
收集故障信息。