【服务器数据恢复】服务器RAID模块硬件损坏的数据恢复案例
服务器数据恢复环境&故障:
某品牌服务器中有一组由数块SAS硬盘组建的RAID5磁盘阵列,服务器操作系统是WINDOWS SERVER,服务器中存放企业数据,无数据库文件。
服务器出故障之前出现过几次意外断电的情况,服务器断电重启后没有发现异常,直到最后一次断电重启后RAID报错:“无法找到存储设备”,进入RAID管理模块后进行任何操作都会死机,服务器管理员多次重启服务器仍然无法进入系统。为了防止服务器内数据丢失,管理员联系我们数据恢复中心寻求帮助。
服务器故障分析:
在这种情况下服务器数据丢失大多是意外断电导致RAID模块损坏(包括RAID管理信息丢失和RAID模块硬件损坏)导致的。RAID阵列创建完成后RAID管理模块信息就不会再发生改变,但是服务器意外断电却很容易导致RAID管理模块信息被篡改或者丢失,多次断电甚至有可能损坏RAID卡上的元器件。该案例中在RAID管理模块中进行操作就死机的情况极有可能是RAID卡硬件损坏导致的。
服务器数据恢复过程:
1、将故障服务器内所有硬盘编号后取出,由硬件工程师进行物理故障检测,经过检测发现所有硬盘均无明显硬件故障,均可以正常读取。
2、以只读方式将故障服务器内的所有硬盘进行扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件分析raid5结构,获取该raid5阵列的盘序、数据块大小、校验方式等信息。
4、北亚企安数据恢复工程师利用获取到的raid5相关信息虚拟重构raid阵列并进行逻辑校验,校检无误后开始验证重要数据,经过验证,重要数据均已恢复。
5、交由用户方工程师检验恢复出来的数据,经过仔细检验,用户方确认所有需要的数据均已恢复,认可数据恢复结果。服务器数据恢复工程师协助将恢复数据迁移到用户方准备好的环境中。本次数据恢复工作完成。