服务器

服务器数据恢复背景描述:
需要进行数据恢复的磁盘阵列是两组分别由4块600G容量的SAS硬盘组成的raid5磁盘阵列,ext3文件系统、lvm结构。
磁盘阵列中1号硬盘离线,热备盘启动同步,在同步过程中同raid中3号硬盘故障掉线,该组Raid阵列崩溃,LVM结构不完整,文件系统无法正常使用,服务器瘫痪。管理员检查了掉线的两块硬盘,1号硬盘无法识别,3号硬盘可以识别。

磁盘阵列数据恢复方案:
首先对故障硬盘进行修复,这一步需要借助数据恢复软件对故障硬盘进行备份,然后将raid阵列中未掉线的所有硬盘和另一组正常的raid阵列进行全盘备份。
然后工程师分析raid中的相关信息,根据raid信息重新组建阵列,找到LVM信息,重组LVM卷,再进一步分析EXT3文件系统,恢复并导出全部数据。

数据恢复过程:
1、首先由硬件数据恢复工程师对无法识别的1号硬盘记性开盘检测,硬盘盘片磨损非常严重,无法进行数据恢复,在后续的数据恢复过程中只能按照缺盘状态进行处理。
2、借助数据恢复软件对掉盘raid阵列和正常阵列全部进行全盘备份,数据备份情况如下:

3、根据备份数据对原raid磁盘阵列中的校验方式、条带大小,硬盘盘序等信息进行分析,并根据分析的得出的raid信息重组出两组raid阵列。重组raid截图如下:

4、工程师将两组raid重组完成后开始分析底层数据,尝试分析出lvm结构相关信息并导出作为pv的lun,借助数据恢复软件重组pv并重新生成lvm逻辑卷,过程如下:

5、LVM重组之后,对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出其中的全部数据。数据恢复结果如下:

raid数据恢复结果:
由于阵列中的1号硬盘盘片划伤严重无法修复,且部分硬盘中存在坏道,raid结构中可能存在缺陷,但大部份文件经验证后恢复成功。

Raid5两块硬盘离线导致服务器瘫痪的解决方法-冯金伟博客园