大数据-之LibrA数据库系统告警处理(ALM-37004 Datanode主备不同步或者断连)
告警解释
当DN主实例与DN备实例连接异常时,产生该告警。
告警属性
告警ID | 告警级别 | 可自动清除 |
---|---|---|
37004 | 严重 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
ServiceName | 产生告警的服务名称 |
RoleName | 产生告警的角色名称 |
HostName | 产生告警的主机名 |
Instance | 产生告警的实例 |
对系统的影响
DN主实例的Redo日志将自动发送到对应的DN从备实例,会增加该DN从备实例所在物理节点上的网络压力。
系统自处理过程
当DN主实例与对应的DN备实例连接异常时,DN主实例的Redo日志将自动发送到对应的DN从备实例,不影响业务的运行。
可能原因
DN主实例与对应的DN备实例连接异常。
处理步骤
查看告警原因。
- 执行如下命令查看集群DN主备实例是否故障。
gs_om -t status --detail
- 是,修复故障实例,具体方法请参考“修复MPPDBServer实例”。
- 否,执行2。
- 查看集群DN主备实例所在机器网络是否正常,比如DN主实例所在机器或者备实例所在机器机使用的网卡为eth0,使用下面命令查看网络是否正常。
/sbin/ifconfig eth0
- 如果网卡正常,执行3。
- 如果显示网卡不正常,请及时联系硬件工程师修复网卡,再执行3。
- 查看告警是否仍然存在。
- 是,执行4。
- 否,处理完毕。
收集故障信息。