EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程
admin
2023-03-12 19:41:18
0

服务器故障描述:
山西某公司一台服务器的EMC FC AX-4存储RAID5磁盘阵列,阵列中共有12块硬盘组成raid5磁盘阵列其中有两块硬盘为热备盘,阵列中硬盘单盘容量为1TB,服务器中有两块硬盘离线,一块热备盘未启用。客户将服务器中所有磁盘带到数据恢复公司。
通常情况下造成服务器硬盘离线的原因为磁盘物理故障或者硬盘坏道。但是由于EMC控制器有着十分严格的磁盘检查策略,容易将性能不稳定的硬盘判定为硬件故障提出raid组,所以导致服务器崩溃的原因也有可能是磁盘读写不稳定。

服务器数据恢复解决过程:

第一步:检测硬盘和服务器数据备份;对服务器中所有磁盘进行物理故障检测,硬盘没有物理故障,然后使用坏道检测工具进行硬盘坏道排查也一切正常。使用专业镜像工具将raid中所有磁盘做全盘镜像。如下图:
EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程

第二步:分析RAID组结构;Raid数据恢复的常规步骤先要对服务器raid信息进行分析,然后重构raid组。在本案例中分析发现作为热备盘的6号盘和9号盘全部无数据,6号盘已经成功激活并替换了磁盘阵列中的5号硬盘,但数据并未同步。继续对该服务器raid中的其他硬盘进行条带大小、数据的分布规律、磁盘顺序等必要信息进行分析。分析发现7号硬盘在同一条带上的数据与该raid中其他硬盘不同,初步确认该盘为掉线较早的硬盘,使用数据恢复公司自用的raid校验程序对此条带进行校验发现最好的数据就是除去7号盘以后的数据,所以7号盘为先掉线盘无疑。将分析出来的上述信息通过北亚自主研发的raid虚拟程序组建出原raid磁盘阵列。

第三步:对服务器磁盘阵列中的LUN信息进行分析;该服务器底层只分配了一个LUN,所以工作量相对小很多,只需对一个lun的信息进行分析,分析后使用raid恢复程序记性解释map数据并导出。然后使用自用软件进行zfs文件系统解释,某些文件系统文件在解析时报错。工程师只好手动对程序做debug调试后发现报错原因为服务器突然瘫痪导致某些元文件损坏,现有程序无法正常解释。因此需要对这些损坏的文件系统元文件做修复,才能正常解析ZFS文件系统。分析损坏的元文件发现,因当初ZFS文件正在进行IO操作的同时存储瘫痪,导致部分文件系统元文件没有更新以及损坏。人工对这些损坏的元文件进行手工修复,保证ZFS文件系统能够正常解析。

第四步:导出所有成功恢复数据;利用程序对修复好的ZFS文件系统做解析,解析所有文件节点及目录结构。对所有成功恢复的数据进行验证,数据完整。部分文件目录和验证截图如下:
EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程
EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程
EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程

相关内容

热门资讯

为190元“仅退款”榴莲千里讨... 极目新闻记者 王鹏因为一笔190元的恶意“仅退款”订单,卖家自掏5000余元,驱车1600公里赴山东...
“AI智能回答”误称律师“被判... 据澎湃新闻报道,南京执业律师李小亮发现,在百度手机App、百度网站搜索其个人姓名+职务时,百度“AI...
年初铺的草皮五一咋又铲除?自然... 江西省上饶市的周先生近日向华商报大风新闻反映:今年五一假期时,他注意到上饶市广丰区北河滨路芦林街道源...
浏阳烟花厂爆炸事故4名重症患者... 截至今天(9日)上午11时,浏阳烟花厂爆炸事故在院患者42人,原5名重症患者中4人已转为轻症;在院患...
中东战火不断,为何全球股市不跌... 最近与一位美国学者交流,他讲到一个颇有意味的场景:在华尔街一场交流中,包括他在内的3位国际问题研究专...
景区回应“母亲节穿旗袍免费入园... 近日,南京天生桥景区推出的母亲节当天女士穿旗袍免费入园活动引发争议,有人认为母亲节女士穿旗袍活动,策...
一本正经胡说八道,谁为AI幻觉... AI幻觉频发,误导用户、毁损名誉的责任,该由谁来承担?南京律师李小亮在百度上搜索自己的信息,结果百度...
老人在直播间疯狂刷火箭 周佳欣、郑凯丹、朱娅、蒋婉、黄铃、王佳、李婉晴/文64岁的王雅达又往直播间里刷了一枚“火箭”。屏幕上...
汉坦病毒阳性乘客在乌斯怀亚港登... 自世卫组织(WHO)5月6日公布荷兰泛海探险公司(Oceanwide Expeditions)旗下极...
冰箱不制冷的原因有哪几种 冰箱的电压在正常的情况下,压缩机没有正常的运转,而且有噪声和旋转的声音,压缩机一旦出现故障,冰箱就会...