IBM DS4300阵列控制器电池的更换过程

IBM DS4300阵列控制器电池的更换过程
IBM DS4300阵列控制器电池的更换过程

IBM DS4300阵列控制器电池的更换过程

前几天,系统下面一应用部门电话反映,他们应用程序在使用时经常出现连接数据库失败的情况,跟以前的错误提示不同,询问软件开发,而开发不在现场,要求了解现场服务器配置情况,当时没有多想,也认为是软件开发的问题,而且还有其它应用也在用,但都正常。正好赶上值班,就登到服务器想做一下例行检查,在检查系统错误报告(errpt -d H -T),结束发现很多硬件的错误提示(B9735AF4 1126093407 P H dac0 SUBSYSTEM COMPONE NT FAILURE),用命令(errpt -aj B9735AF4 |pg),里面解释说可能是阵列电源或风扇等问题,然后在网上找有好多说是电池的问题,仔细观察阵列后面的故障指示灯状态,在每个控制器上有并排三个故障指示灯,这个是两个控制器,其中左边一个控制器的三个指示灯左起第一个有个电池符号指示是绿色亮灯,其它二个不亮;面右边控制器的三个指示灯是左起第一个有电池符号的不亮,第二个也不亮,第三个指示黄色亮灯,因为集成商没有给阵列管理软件,自己也没尝试连过阵列,而且又是生产用设备,还是晚上值班,只有待第二天再继续处理。

第二天上班,问了一下IBM 800,一看设备还没有过保,就直接报修,很快当地的IBM 服务部门就联系我们,约定下午下班后用户使用不多的情况下,进行检查更换,IBM的服务人员按约定时间赶到,先将连到服务器的网络断开,将双机HA停掉,数据库停掉,然后IBM的人员就连上阵列,检查电池的情况,显示一块电池FAILURE,另一块也要过期,然后他就对阵列升级了微代码,再次检查电池情况,这时显示一块电池仍然FAILURE,另一块已经正常,然后他就提出需要更换一块电池,这期间曾要求他将二块电池一起换掉,可他说这是公司的处理程序,经过这样处理,正常的就不能给予更换(总感觉这点IBM不太厚道),他们公司规定,我也不好难为工作人员,先更换块的电池,不影响设备正常工作就好。很快IBM工程师就取下控制器,更换好电池,然后恢复连接,再通过阵列管理软件处理,检查,显示一切正常,然后再把HA和ORCALE启来,稍等一会网络连接也恢复,在客户端测试应用程序连接正常,至此DS4300更换故障电池结束,避免了可能出现的数据访问缓慢,甚至造成数据错误的损失。

以下是更换步骤:

操作之前用SM软件备份ds4300存储的profile文件和collect all data...

1、做之前先做了个逻辑备份(花了1周左右的时间)

2、停ORACLE数据库(AIX上停集群:smit clstop),不让操作存储上的数据

3、同时连通DS4300的两个控制器,可用交换机把两个控制器和管理机都连起来。

4、打开SM管理软件,查看控制器B的属性(一个一个换)上有几个RAID

5、把在B控制器上的RAID切换到A控制器,再把B控制器OFFLINE(确认已切换到A控制

器,最好记录一下有哪些被切换到A控制器),B控制器的HOST灯会来掉

6、拧开B控制器的螺丝,带电操作,把B控制器拔出,并更换电池,完后再插回去(也是

带电插拔)。大概稍等几分钟后,用SM软件重新连上去,把B控制器ONLINE上去

7、正常后,就可以操作A控制器了,操作步骤类似

8、最后把相应的阵列切换到以前的控制器中去

9、大功告成

注意:一定要带电操作,否则如果不匹配的话可能会导致存储起不来

IBM FastT600更换控制器电池步骤

一. 机器故障现象

通过Storage Manager8进入到系统里面,“Recover from failures(小听诊器)”在闪动,点开后,发现里面报A、B控制器电池错误,即有效期已到,一般是3年。

二. 更换步骤

备份数据,里面有两个逻辑盘,分别放在A控制器和B控制器。

先在B控制器里操作(带电热插拔控制器):

1. 在SM里面,用鼠标右键点Arr2>>2(逻辑盘2)>>change>>Cache Settings,把Enable read caching 、Enable write caching、Enable write caching without batteries前面小方框的的“勾号”去掉,点OK,即把Cache关了;

2. 然后在右边栏目里,Back一栏里,用鼠标有键点控制器B,选Place>>offline,即把控制器B关掉;

3. 取下来B控制器,更换电池,把控制器B再插入原来位置;

4. 然后在右边栏目里,Back一栏里,用鼠标有键点控制器B,选Place>>online,即把控制器B打开;

5. 用鼠标右键点Arr2>>2(逻辑盘2)>>change>>Cache Settings,把Enable read caching 、Enable write caching、Enable write caching without batteries前面小方框的“勾号”加上,点OK,即把Cache打开;

6. 在SM里看到两个逻辑盘现在都在A控制器里面,正常切换;

7. B控制器电池更换完毕。

然后在A控制器里操作(带电热插拔控制器):

1. 在SM里面,用鼠标右键点Arr1>>1(逻辑盘1)>>change>>Cache Settings,把Enable read caching 、Enable write caching、Enable write caching without batteries前面小方框的的“勾号”去掉,点OK,即把Cache关了;

2. 然后在右边栏目里,Back一栏里,用鼠标有键点控制器A,选Place>>offline,即把控制器A关掉;

3.取下来A控制器,更换电池,把控制器A再插入原来位置;

4.然后在右边栏目里,Back一栏里,用鼠标有键点控制器A,选Place>>online,即把控制器A打开;

5.用鼠标右键点Arr1>>1(逻辑盘1)>>change>>Cache Settings,把Enable read caching 、Enable write caching、Enable write caching without batteries前面小方框的的“勾号”加上,点OK,即把Cache打开;

6.在SM里看到两个逻辑盘现在都在B控制器里面,正常切换

7.A控制器电池更换完毕。

三. Arr1>>1(逻辑盘1)切换到A控制器

1.笔记本、控制器A后的以太网口,通过网线连接,ping 192.168.128.101,不通(控制器A的IP地址以前同事改过,现在忘了)。然后再ping 192.168.128.102,还不通;2.通过窜口线连到控制器A后面,登陆,密码—infiniti(小写)、passw0(数字)rd(大小写)试了无数次,都登陆不进去,后来用passw0(字母)rd一试,进去了,差点晕倒;3.用netCfgShow命令一看,控制器A的IP地址为192.168.0.1;

4.更改本本上的IP地址,网线接到控制器A,通过SM管理,用鼠标右键点Arr1>>1(逻辑盘1)>>Change>>Ownership/Preferred Path>>Controller in Slot A,选Yes

5.看到两个逻辑盘分别在A、B控制器里。

四.完毕

SM9的步骤有一点区别,不用disable cache,另补还要再备份一下all support data

相关主题
相关文档
最新文档