企业新闻 - 正文
IBM小型机故障处理总结 2021-07-20 10:03
IBM小型机故障处理总结

故障现象描述:
2021年7月5日16:06,用户报修故障,IBM P750宕机,报警输出电压异常。
项目经理接到用户报修以后,依据该用户的特殊性和SLA时效性要求,第一时间安排工程师进行远程联络:
 
处理过程:
2021年7月5日16:06,用户报修故障。
2021年7月5日16:09,工程师远程查看设备故障情况,基本判断为主板故障,并协调了备件。
2021年7月6号9:52,运维工程师到现场进行进一步查看,更换主板,更换主板完成后设备可以正常启动,但是无法识别硬盘,怀疑其他硬件存在问题。
2021年7月7日,运维工程师带着新主板、硬盘笼子、raid卡和两块新硬盘到达现场。更换新主板后无法发现系统硬盘。更换硬盘笼子和加上raid卡后也无法发现硬盘。
2021年7月8日上午,经过反复测试,恢复出厂设置、用光盘引导到维护模式也无法正常识别到硬盘,用新带来的硬盘插上空余槽位能正常识别新硬盘,如下图:
得出结论因两块硬盘故障导致系统无法启动,随即和客户沟通后续解决方案,是否是安装新系统然后恢复数据,最后客户决定重新安装系统,按照客户原来系统版本安装新系统。

系统安装完成后按原来的配置,配置IP和主机名,安装软件包。

查看系统状态。


导入存储盘VG信息。
在硬件启动过程中发现小机有一块HBA卡有问题,立即调备件更换,更改存储映射关系。

在硬件启动过程中发现小机有一块HBA卡有问题,立即调备件更换,更改存储映射关系。

系统安装完成,未发现其它硬件故障,故障处理结束。
 
故障分析:
  • 设备故障有主板、硬盘和HBA卡。
  • 按客户要求重新安装AIX操作系统,配置底层环境。
  • 处理结果:
  1. 硬件故障处理完成
  2. 小型机系统安装和底层环境搭建完成。
  3. HBA卡已更换,存储映射关系已更改。

故障总结建议
故障处理完成后,我们建议用户:
  1. 做操作系统备份,系统出现故障可以恢复。
  2. 增加系统巡检工作,日常对系统报警进行查看。


  • 联系我们

    电话:400-6296-001 网址:www.tanghop.com 邮箱:support@tanghop.com 地址:北京市昌平区新飞达电子科技工业发展中心 1号楼F6-6(102206)
  • 关于我们

    北京唐合易成科技发展有限公司

    北京唐合易成科技发展有限公司成立于2010年,是一家IT解决方案和服务综合提供商。自成立以来,唐合易成始终致力于为用户提供IT系统架构咨询、解决方案、系统集成、系统维护和运维服务。 唐合易成凭借自身强大的计算机信息系统建设团队及多年积累的信息化建设经验,可独立承担并完成国内领先数据中心的信息系统建设和IT外包服务,在政府、电信、金融、能源、教育及制造业等传统行业积累了丰富的案例。

Copyright © 2014-2016 北京唐合易成科技发展有限公司. All Rights Reserved.  京公网安备11011402012845号 京ICP备16043117号-1