首页 > 学技术 > 技术网文 > AIX > 正文

[原创] 远程测试hacmp方案。[原创]


来源 chinaunix.net 酷勤网整理

hacmp 远程测试方法

前期准备工作:

     确认所有节点服务器上面的cluster进程均在正常运行。

     #ps -ef |grep cluster

     如果你的设备上面有至少两个cluster进程,那么证明是cluster是正常运行的。


测试内容:

A:主机主备网卡切换;

    察看/etc/hosts.明确postXXzj1_svc的地址。

    在两台机器上分别使用#ifconfig -a察看当前的ip地址,确认主机位置;

    使用#ifconfig -a确认postXXzj1_svc地址所在的网卡,为enX.

    #lscfg -vpl entX   (X为你设备上具体的en设备的号码,如ent0或ent1等)

    察看该命令的反馈,确认最后一行上面标注的物理位置码:

    P2/E1或者P2/E2指的是集成网卡;

    P2/Ix-Q1,其中大写I字母后面跟的数字就是指的是PCI插槽的号码;

    在设备PCI插槽后面标有数字。记录postXXzj1_svc对应的具体网卡位置

    在备机上可以开个窗口不断地ping这个svc地址;

     将postXXzj1_svc对应的网卡上的网线取下;

      **************此步骤也可以通过#ifconfig enX down远程完成;

     此时,窗口中间应该出现中断;在至多30秒钟内ping应该能够恢复;

     在主机上使用#ifconfig -a再次察看svc对应的具体物理网卡;

     此时物理网卡应该已经完成相应切换;

     整个过程可以使用#tail -f /tmp/hacmp.out跟踪察看;

     确认当前切换已经完成之后,可以将取下的网线接回。

     hacmp.out中间会产生jion_stby事件;并且会指明相对应的节点名称和stby地址;

     该网线接回后,原来的svc地址对应的网卡现在绑定的是1_stby地址,

     并且svc地址不会再交回原来对应的具体的物理网卡;

B:主机TAKEOVER测试;

     在主机上运行#smitty  clstop 。

     在shutdown mode选项中间选择takeover。

     完成该命令后,主机上的数据库、vg、IP地址均应还原到HACMP启动之前的初始状态;

B.a在备机上#ifconfig -a 察看IP地址是否已经变成postXXzj1_svc。(也可使用#netstat -i)

     此时如接管正常,在备机上应该存在的ip地址是postXXzj2_boot以及postXXzj1_svc;

     此时#hostname 应该是postXXzj2;
 
      #lsvg -o察看当前激活vg,应该包括havg;(有些地市共享vg名称为oravg);

      #mount 察看当前激活的文件系统;应该包括/disk1 ,/disk2, /disk3;

      #ps -ef|grep ora 察看相应的oracle进程是否启动;

      #ps -ef|grep mid察看相应的中间件进程是否启动;

      如上述命令反馈均正常,则证明hacmp工作正常,备机已经正常接管主机业务;

      如果出现异常情况,可以察看备机上的/tmp/hacmp.out,了解hacmp事件具体进度;

      如事件进度不明,请转至ftp hacmp.out处理方法,详情见文档(how to ftp hacmp.out)
     
      如状态正常,在主机上启动hacmp #smitty clstart;

      项目中间所有hacmp rg 均使用cascading 工作方式,主机恢复后备机应该会交回相关资源;

      如上述方法在主机上察看相应的资源状态,确认主机是否能够接管rg中间指定的资源;

      若交回过程正常,可以在5分钟后进入下面的测试。(需要5分钟时间让cluster完成脚本纪录

      及相关事宜,保证此点可以让测试不会加入其他不稳定因素)

       建议整个过程中间使用#tail -f /tmp/hacmp.out跟踪察看相应的事件进度;

C:主机关机测试;

      直接关掉主机电源(白色按键)。

       不要使用#shutdown关闭主机,这样关闭系统不会引起接管。

      转至B.a点察看备机的工作状态;如果B类测试通过正常,那么C类测试也会正常;



[color=red]欢迎大家补充。谢谢![/color]



 starmoon2003 回复于:2003-06-21 09:38:37

老大,我测过了,如果将网卡down掉,对系统有十分大的影响。


   建议还是拔网线为好。。。。。


 bird_man 回复于:2003-06-21 10:01:04

我是ES版本,用lssrc -g cluster看进程只有两个呀


 icewood 回复于:2003-06-21 10:37:05

不错,比较详细。


 yanbing 回复于:2003-06-21 13:34:51

上面的文档是这段时间远程测试14地市hacmp双机的方案,写好给客户的。
拿出来献丑了,呵呵!!

下面是cluster四个进程的各自作用,是ibm网站上的转贴:

 Cluster Manager daemon(/usr/sbin/cluster/clstrmgr):是HACMP的核心进程,运行于每个群集节点,监视群集目标,如节点、网络接口、网络等的变化,生成事件,激活相应的事件脚本程序script做处理。

 Cluster SMUX Peer daemon(/usr/sbin/cluster/clsmuxpd):也运行于每个群集节点,通过clinfo对客户端应用提供SNMP支持,该守护进程维护管理信息库MIB(Management Information Base)中的群集状态,可通过标准的SNMP函数访问这些数据,注意同时要运行snmpd。

Cluster Information Program daemon(/usr/sbin/cluster/clinfo):可运行于任一群集节点或RS6000客户机,通过查询SMUX Peer,来维护群集状态拓扑图,并为客户端提供应用程序接口API来访问这些数据。

 Cluster Lock Manager daemon(/usr/sbin/cluster/cllockd):群集配置成共同访问的方式,需要该守护进程运行于每个群集节点,通过API为应用访问共享磁盘提供加锁功能,避免冲突。


 clic 回复于:2003-06-23 13:23:21

还要详细点就好,就可以直接给客户了.


 ocmocp 回复于:2003-07-04 00:18:43

写的真好


 老农 回复于:2003-07-04 00:50:02

引用:原帖由 "starmoon2003" 发表:
老大,我测过了,如果将网卡down掉,对系统有十分大的影响。


   建议还是拔网线为好。。。。。

     
实际是一样的啊,有什么问题吗?


 andrewqiu 回复于:2003-07-04 09:21:16

远程测试有实际意义吗?




原文链接:http://bbs.chinaunix.net/viewthread.php?tid=96965
转载请注明作者名及原文出处



收藏本页到: