EMC VNX2代产品base module的更换
EMC VNX2代有一个新的部件叫做base module,这个是个易损备件,base module故障,也会导致控制器挂掉。
Base Module其实也是一个IO module,只要是IO module,就不能直接插拔更换。很多朋友判断一个FRU部件是否可以热插拔的原则是看是否可以直接拆下来,我是服了you呀。如果强行插拔IO module,基本上控制器都会panic重启的。由于没有了io module,控制器也起不来。
写这个的目的是给一个朋友,卖一个备件,送一篇文档。如果有其他故障问题,可以加vx: StorageExpert 进一步探讨。
由于base module的更换要将和其对应的控制器下电,所以要提前检查客户多路径配置是否正常。如果有单路径业务会造成业务中断。
在操作前将write cache暂时disable。
首先在Unisphere中把disable 并且zero out 系统的write cache,如下图:
System->system management-> manage cache
把write cache disable了,如下图所示:
- 首先找到有问题的base module位置,如下图所示:
- 将对应的控制器下电
使用naviseccli命令对控制器做shutdown操作,命令如下
Naviseccli -h <IP address> -user - password -scope 0 shutdownpeerSP
这里的IP地址是正常控制器的,不是要shutdown控制器的。注意后面的命令是 shutdownpeerSP,就是把对端的控制器给shutdown下来。
然后ping这个sp,如果ping不到了,说明这个sp已经shutudown了。
- Base module上有BBU和电源模块,还有接后端的SAS线,将这些线缆做标记,然后断开连线。
- 将有问题的base module从机器上拆除,换上新的base module,按照之前的线缆标记插回线缆。
- 对控制器重新加电,命令如下:
Naviseccli -h <IP address> -user - password -scope 0 rebootpeerSP
- 控制器启动需要大概10-15分钟左右,登录图形界面观察控制器的状态。也可以ping这个控制器的IP地址来判断控制器是否正常启动。
备注:如果命令行有困难,也可以通过插拔控制器的方法来上电和下电。但一定要将write cache disable掉再做上面的动作。
- 控制器正常后,将write cache enable,否则会影响客户业务性能。