企业新闻 - 正文
真实案例——IBM DS8700 故障处理案例分享 2019-03-05 17:33
唐合易成提供各类存储设备运维服务和备件支持服务,服务涵盖IBM DS 系列产品、HP SUPERDOME产品、EMC DMX系列产品等市场在销所有品牌和型号。近期我们会大家分享此类产品的故障解决案例,欢迎大家持续关注近期公众号。
故障处理背景:
2018年12月20日10:00时,我司接到重庆地区某政府部门行政单位用户报修,用户方现场工程师预计DS8700发生硬盘故障。
当天我方工程师即赶到用户现场,发现确实有一块硬盘报错,但更换多次硬盘报警都不能消除,且健康检查报错。
针对以上情况,我方工程师综合考虑后,进行如下处理,现和大家分享:
1.再次检查DS8700存储状态,确认没有新的报错。如果有,则先处理新的报错。
2.通过DS8700 HMC的exchange FRU菜单,假换U1400.2B3.RJ22422对应IO笼的C7 SPCN卡。在假换过程开始之前,DS8700会首先自动检查RJ22422 IO笼及笼中的DA、SPCN卡的状态,同时也会校验与RJ22422 冗余IO笼及此笼中的DA、SPCN卡的状态。DS8700存储确认冗余有效,才会允许SPCN卡假换的进行,确保对生产无影响。
3.在SPCN卡的假换过程中,需要对RJ22422 IO笼进行下电和上电的操作,如上所述,DS8700存储确认冗余有效,才会允许下电和上电操作的进行,确保对生产无影响。
4.完成SPCN卡的假换之后,检查RJ22422 IO笼中DA卡的状态:DA卡状态仍然处于异常状态,通过DS8700 HMC的exchange FRU菜单,假换此DA卡,然后再进行RJ0BTJT-P1-D13硬盘的更换。
5.以上操作仍然不成功,进入控制器底层系统中,进行ODM库的修改。
6.在AIX系统下进行ODM库的修改,设备恢复正常。
在本次的故障处理过程,共使用
硬盘:450G 10K硬盘 PN:17P9905 数量:3
DA卡: PN:45W2867 数量:1
IBM DS8700 设备图片:
现场维修服务记录报告
故障处理背景:
2018年12月20日10:00时,我司接到重庆地区某政府部门行政单位用户报修,用户方现场工程师预计DS8700发生硬盘故障。
- 项目经理接到用户报修以后,依据该用户的特殊性和SLA时效性要求,第一时间安排工程师进行远程联络:
- 协调用户方现场工程师抓取最新的日志PE。
- 由我方工程师进行日志分析,定位故障情况,确认软硬件问题、制定处理故障思路、研究处理故障方案。
- 与用户确认进场处理故障的时间。
当天我方工程师即赶到用户现场,发现确实有一块硬盘报错,但更换多次硬盘报警都不能消除,且健康检查报错。
针对以上情况,我方工程师综合考虑后,进行如下处理,现和大家分享:
1.再次检查DS8700存储状态,确认没有新的报错。如果有,则先处理新的报错。
2.通过DS8700 HMC的exchange FRU菜单,假换U1400.2B3.RJ22422对应IO笼的C7 SPCN卡。在假换过程开始之前,DS8700会首先自动检查RJ22422 IO笼及笼中的DA、SPCN卡的状态,同时也会校验与RJ22422 冗余IO笼及此笼中的DA、SPCN卡的状态。DS8700存储确认冗余有效,才会允许SPCN卡假换的进行,确保对生产无影响。
3.在SPCN卡的假换过程中,需要对RJ22422 IO笼进行下电和上电的操作,如上所述,DS8700存储确认冗余有效,才会允许下电和上电操作的进行,确保对生产无影响。
4.完成SPCN卡的假换之后,检查RJ22422 IO笼中DA卡的状态:DA卡状态仍然处于异常状态,通过DS8700 HMC的exchange FRU菜单,假换此DA卡,然后再进行RJ0BTJT-P1-D13硬盘的更换。
5.以上操作仍然不成功,进入控制器底层系统中,进行ODM库的修改。
6.在AIX系统下进行ODM库的修改,设备恢复正常。
在本次的故障处理过程,共使用
硬盘:450G 10K硬盘 PN:17P9905 数量:3
DA卡: PN:45W2867 数量:1
IBM DS8700 设备图片:
现场维修服务记录报告