服务器数据恢复—raid5阵列故障导致上层系统分区无法识别的数据恢复案例
服务器数据恢复环境:
某品牌DL380服务器,服务器中三块SAS硬盘组建了一组raid5阵列。服务器安装Windows Server操作系统,划分了3个分区,D分区存放数据库,E分区存放数据库备份。
服务器故障:
RAID5阵列中有一块磁盘出现故障,该硬盘对应的指示灯亮红色。RAID5阵列瘫痪,D分区不可识别,E分区虽然可以识别,但是拷贝备份文件报错。管理员重启服务器,RAID5阵列上离线的硬盘自动上线开始同步数据。同步还没有完成时管理员强制关机,之后再没有动过服务器。
服务器数据恢复过程:
1、将故障服务器中的3块磁盘标记后取出,硬件工程师检测后没有发现有硬盘存在物理故障,都可以正常读取。以只读方式将所有磁盘进行扇区级全盘镜像,在镜像过程中没有发现有硬盘存在大量坏道。镜像完成后将所有磁盘按照原样还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据。获取到重组raid5阵列所需要的raid相关信息并根据这些信息重组raid。raid重组完成后进行异或校验,但是只有部分校验通过。离线硬盘上线之后会自动进行同步,导致数据损坏。只有部分校验通过意味着数据损坏。
3、尝试在多种硬盘离线状态下提取数据,每种硬盘离线状态下所提取的数据都是一样的。
4、分析修复E分区中的dat文件,发现两个备份文件都有损坏。
5、分析&聚合dat碎片,验证dat数据的完整性,底层结构显示有损坏。
6、分析扫描D分区的数据文件。可能是因为进行过数据同步,数据文件目录不可见。
7、扫描D分区自由空间数据页,分析&聚合文件碎片。验证数据文件碎片的完整性和有效性。
8、提取备份文件中的数据记录到新建的数据库中。
9、通过上层应用连接数据库,验证数据可用性。数据库文件可以正常加载,上层应用中用户账号正常,可以进行正常数据查询。用户认可数据恢复结果。