一、故障描述
1、客户多台主机系统同时报错存储磁盘故障,初步推断是存储出现故障。
2、工程师到达现场检查后发现一台EMC CX3-80存储报错,部分LUN报Bound Unassigned,检查报错LUN发现它们分布在不同的raid组上,存储未报硬盘故障。
3、进一步检查报错LUN,发现它们已经没有归属,Current Owner为N/A,另外,报错LUN均为offline状态, 2个控制器的write cache 均 disabled。
二、故障分析
收集SPcollect,分析TRiiAGE_Analysis.html文件。BugCheck导致SPA异常重启,SPA重启时,SPB也发生故障,此故障情形与掉电情形相似,出现了dirty cache问题。
三、故障解决
1、在进行操作前需提前与客户沟通,因为清除 LUN 的dirty cache,会使LUN在cache上的数据被清除,有可能导致系统的数据库发生问题。
2、找一台可以连接存储的主机,安装EMC remote软件,进入2个控制器的底层windows 系统清除dirty cache。
3、进入控制器的底层 windows 系统查看,dirty cache 的 LUN 列表如下:
4、在TRiiAGE_Analysis.html文件上核对LUN号,ALU是我们平时看到的ID,FLU是系统的ID。核对完成后,进行清除dirty cache操作(在2个控制器上分别操作)。
5、全部清除完成后,Navisphere 检查 LUN 已处于 online 状态,存储显示正常,主机的磁盘状态已正常。
四、经验总结
1、在遇到存储出现dirty cache问题时,应查阅相关资料,谨慎操作。
2、在清除LUN的dirty cache前,务必向客户说明,操作可能会导致LUN的cache数据丢失的情况,以确保操作安全顺利进行。
如欲了解更多,请登录365bet足球比分官方网站:09t2.sockssky.com