服务器数据恢复—raid5阵列热备盘上线失败导致EXT3文件系统不可用的数据恢复案例
服务器数据恢复环境:
两组分别由4块SAS硬盘组建的raid5阵列,两组阵列划分的LUN组成LVM架构,格式化为EXT3文件系统。
服务器故障:
一组raid5阵列中的一块硬盘离线。热备盘自动上线替换离线硬盘,但在热备盘上线同步数据的过程中,又有一块硬盘离线,导致热备盘同步失败。该组raid阵列崩溃,LVM结构不完整,文件系统无法正常使用。
将2块离线硬盘做好标记后取出&进行检测,发现先离线的硬盘无法识别,初步判断该硬盘出现硬件故障,需要开盘修复,另一块离线硬盘可以识别。
服务器数据恢复过程:
1、在无尘车间中对先离线的硬盘进行开盘。开盘后发现该硬盘盘片划伤严重,无法修复,只能对该磁盘阵列进行缺盘处理。
2、将故障raid5阵列中其他成员盘标记后取出,以只读方式进行扇区级全盘镜像。安全起见,对另一组完好的raid5阵列中的全部硬盘做只读完整镜像。
3、基于镜像文件分析硬盘底层数据,结合对EXT3文件系统结构的解析,获取两组raid5阵列的盘序、条带大小、校验方向等重组raid5阵列所需信息,根据这些信息重组两组raid5阵列。重组故障raid时注意进行缺盘处理。
4、重组出两组raid5阵列之后,通过分析两组raid的底层数据找到LVM结构信息。分析LVM结构,导出两组raid中作为PV(LVM物理卷)的LUN,然后将两个PV重组,重新生成LVM逻辑卷。
5、LVM重组之后,通过北亚企安自主开发的工具解析LV(逻辑卷)中的EXT3文件系统,恢复并导出其中的全部数据。
6、用户方对恢复出来的数据进行检测后,确认恢复出来的数据完整有效。认可数据恢复结果。