昆腾Dxi8500虚拟带库故障处理分享
故障处理背景:
2020年5月26日,我司接到某金融行业用户报修昆腾Dxi8500虚拟带库故障。项目经理接到用户报修以后,依据该用户的特殊性和SLA时效性要求,第一时间安排工程师进行远程联络,安排工程师进场。
故障1现象描述
sda2分区故障
故障分析过程
sda2分区故障导致scratch文件系统只读,进一步影响虚拟带库软件及相关服务启动。
故障解决方案
申请root口令修复scratch文件系统。
故障处理过程
修复完成后重启系统,不在提示EXT3-fs error (device sda2),测试日志收集功能也恢复正常。
故障2现象描述
1.virtual disk BPMD_8的状态为critical,有坏块。
2.VPMD_8故障导致系统崩溃。
3.DXi8500虚拟带库进入诊断模式。
故障分析过程
系统卷BPMD_8由于raid1双盘故障,导致系统崩溃。由于日志缺失,没找到raid1第一块硬盘故障的报错信息。
故障解决方案
由于系统崩溃,需要重新安装系统和应用,重新安装前整理DXi8500虚拟带库的重要信息:
1.记录DXi8500虚拟带库的版本号:
2. 记录创建的VTL信息:
3.记录DXi8500的SN:
###20:35:57### -Hostname- '/bin/hostname': DXi8500-434
###20:35:57### -System Serial Number- 'cat /opt/DXi/system-serialnumber': AV1439BVP00048
###20:35:57### -System OEM Serial Number- 'cat /opt/DXi/oemsystem-serialnumber': AV1439BVP00048
###20:35:57### -Node Serial Number- 'cat /opt/DXi/node1-serialnumber': HF1MW12
3. 重新安装操作系统和app。
4. 重新配置VTL。
5. 重新添加host,并映射VTL至host。
故障处理过程
1.确认BPMD_8和sdv的对应关系。
2.确认sdv数据情况并解决系统报错。
3.修复cvfs文件系统。
4.启动hearbeat服务让带库重新自检。
5.检查虚拟带库启动后的硬件状态及配置。