Oracle-ASM磁盘mismatch on ‘Group Creation Timestamp‘
背景:
用户的一套RAC集群在重启之后,CRS服务、集群ASM存储状态异常,检查发现是由于OCR磁盘无法正常mount导致,发生报错ORA-15038: disk '/dev/mapper/xxxocr01' mismatch on'Group
Creation Timestamp'
问题报错:
RAC集群启动,crsctl stat res -t -init 显示CRS服务、集群ASM存储状态异常
问题分析:
查看集群crs的alert日志,我们发现OCR盘存在问题,无法正常的mount挂载
检查asm的alert日志,发现CRSDG由于cell4ocr02磁盘里面记录的磁盘组创建时间与目标磁盘组创建时间不一致,导致CRSDG磁盘组无法正常mount
ORA-15038: disk '/dev/mapper/cell4ocr02' mismatch on 'Group Creation Timestamp' with target disk group [2521094998] [2513876176]
检查当前CRSDG的磁盘识别情况,状态为member的磁盘一共有7块,存储cell1-3有5块ocr磁盘ocr01-02,存储cell4有2块ocr磁盘ocr01-02
查看当前集群里面记录CRSDG磁盘路径名分别为存储cell1-3的ocr01,ocr02,并没有包含存储cell4的ocr磁盘ocr01-02
询问用户,确认到存储cell4最近才加到该RAC集群上面,只用于存放data数据,并没有存放ocr的数据,cell4存储上的磁盘/dev/mapper/cell4ocr01-02应该是之前其他环境的CRSDG磁盘,并不属于当前集群的CRSDG磁盘,所以导致在mount挂载OCRDG磁盘时出现cell4ocr02磁盘里面记录的磁盘组创建时间与目标磁盘组创建时间不一致的情况
问题解决:
确认cell4存储上的磁盘cell4ocr01-02不属于当前集群的CRSDG磁盘之后,我们解决该问题的方法就是让当前集群不要识别到这两块磁盘,当前磁盘的配置方式为多路径+oracle afd的组合方式,所以,我们只需要在多路径的配置文件multipath.conf里面删除cell4ocr01-02的配置即可
删除多路径的cell4ocr01-02的配置之后,对afd服务进行重启扫描,确认绑定的磁盘路径正确
/etc/init.d/afd stop
/etc/init.d/afd start
/u01/app/19.0.0.0/grid/bin/asmcmd afd_scan
asmcmd afd_lsdsk
随后重新启动集群CRSDG正常挂载,集群恢复正常,问题解决!