首页 > 学技术 > 技术网文 > IBM AS400应用论坛 > 正文

[精华] 惊心动魄十二小时——一次硬盘全部更换的经历


来源 chinaunix.net 酷勤网整理

背景描述:由于客户打算将原有十块旧盘全部换为新盘,所以有了如下更换硬盘的经历;由于客户仅给出十二个小时的硬盘更换时间,所以就有了如下争分夺秒的故事。十二个小时,不多不少,为了能够有充分的时间测试,我们按照时间顺序制定了三套方案:

方案一  由于客户的机器还有两个剩余的槽位,所以打算将两块新盘放在空余槽位中进行硬盘对拷,这样依次进行拷贝,直到十块盘完全拷贝成功,换下(要点:纪录每块盘的对应关系和顺序,优点:速度快,省时)

方案二  用户数据不多,两块新盘足以容纳所有原有数据,因此可以将两块新盘插到空余槽位,REMOVE除load source外的所有硬盘,然后对拷load source,拔下所有REMOVE的硬盘,插入新盘,作数据平衡

方案三  常规磁带全系统备份和恢复
    由于时间紧迫,以上方案,按照时间顺序(最短时间)排列,打算先采用方案一进行操作。
项目操作记录:

时间 步骤
打印系统值和硬件设备列表
由于打算采用硬盘对拷方式,记录系统原有硬盘序号和新硬盘序号,并制作比对表
19:20 停子系统,开始全系统备份
20:57 停机,加入两条新内存和两块新硬盘到空闲槽位,启机
21:05 进入DST停Raid保护(两组)
21:10 进入Work with disk unit将LOAD SOURCE盘(D01)数据拷贝到D11槽位盘中
22:00 报MIRROR错误,忽略!进入Start a service tool进行在线拔硬盘(D11)操作
22:05 继续拷贝D02盘数据到D12新盘中
23:05 提示拷贝成功,但是无法在线拔盘,硬盘灯始终不闪动(无法判断槽位问题,硬盘问题,还是LIC问题)
    项目暂停:由于无法判断问题所在,打算先看看拷贝数据是否成功,再启用备用硬盘REMOVE方案
23:10 通过Start a service tool停机,拔下D12,用D11替换原LOAD SOURCE,在D11,D12插入两块新盘
    开始不断停启机进行换盘操作:
        通过新的LOAD SOURCE启动后,发现原D02无法识别
        通过原有LOAD SOURCE启动后,发现原D02无法识别
        此时面临的境况:无法识别,是系统错误?还是硬盘已经被破坏?难道对拷操作使得两块D02全部被损坏?当初决定对拷就是因为这样可以有效保护用户原始硬盘数据,可是现在——原盘无法识别,新盘无法识别——仅有一盘全系统备份带还保留着用户数据,如果备份带再出问题,那么用户数据将不完整,离他们工作时间还有9个小时。
        通过原有LOAD SOURCE启动后,发现新D02无法识别,显示原D02-MISSING,ASSIGN无效
        重启,报DASD ERROR,认出第二块硬盘为新硬盘(谢天谢地,总算认了出来,这意味着可以进行方案二的操作)。开始IPL以确认数据是否完整。       
        IPL后,显示内存DUMP,B6000408/0417/4058,启动到JOURNAL时报错:D90031FF
0:45 再次尝试IPL,通过了JOURNAL验证,又开始重复重启
1:15 考虑是否为内存错误,拔去新添内存,再重启,失败
这意味着第二套方案也不能使用了
1:30 剩余时间不足,打算采用第三套方案:磁带机全系统恢复。连接磁带机,拔下全部旧硬盘,插入全部新硬盘,01 D M重启
1:40 开始安装内码
2:30 起RAID保护,再加入ASP
5:12 IPL并安装BASE系统
5:20 注意系统值的调整,并添加自动回复列表
5:32 Go restore,注意修改相关参数
7:55 手动恢复未被成功恢复的库
8:15 根据打印的原系统值设定恢复后系统的系统值



 tomroom 回复于:2007-06-12 13:03:22

顶,  没有做过这样的事呵呵


 jackmy 回复于:2007-06-12 13:31:35

为什么不直接用第三套方案呢?


 qingzhou 回复于:2007-06-12 15:12:34

感谢分享~~~

数据安全还是放在首位为宜!


 chts 回复于:2007-06-12 18:43:55

如果我做:(如果有RAID 需要先Stop)
1, 直接用SAVE/RESTORE disk data 的方法升级 Loadsource,
2, 根据当前数据占用的空间并且有2个空槽位给新硬盘, 我估计再对一个硬盘做SAVE/RESTORE disk data ,  就可以了.
3.  把老硬盘 remove
4,   关机加新硬盘
5,  DST 起RAID, ADD diskunit
6,  Normal IPL, 工作完成


 叶华 回复于:2007-06-13 10:14:48

Unix下有个类似Ghost的软件(G4U)  和方案三差不多  但更节约时间  也可以直接使用Ghost

引用:
在windows下装个矮人DOS工具箱,再把C:\boot\grub\下的GHOST.IMG改名为ghost.img(linux是严格区分大小写的!)然后和memdisk.gz一起复制到你linux下的 /boot/grub/ 下. 
再编辑 linux 下的 /boot/grub/menu.lst (要用root账户或用 sudo 命令) 增加: 

title MirrorLegend Ghost 8.2 Tools##起你要的英文名 
root (hd0,?)##问号要改成你linux 安装在分区号。 
kernel /boot/grub/memdisk.gz 
initrd /boot/grub/ghost.img 

linux 所在分区号可参照linux选项的值。 
保存后重启就可以用ghost作备份了。




这个虽然是在Linux下使用 但多少应该会给我们点灵感~

[ 本帖最后由 叶华 于 2007-6-13 10:35 编辑 ]


 arrike 回复于:2007-06-13 10:47:08

更新硬盘,保存数据,方案三套,还是比较周全的。


 bjtzh 回复于:2007-06-13 10:54:47

引用:原帖由 chts 于 2007-6-12 18:43 发表
如果我做:(如果有RAID 需要先Stop)
1, 直接用SAVE/RESTORE disk data 的方法升级 Loadsource,
2, 根据当前数据占用的空间并且有2个空槽位给新硬盘, 我估计再对一个硬盘做SAVE/RESTORE disk data ,  就可以 ... 



能否讲讲SAVE/RESTORE disk data??是在DST下的那个选项?它和COPY DISK UNITS有什么区别?这种方法和方案二有一些相似哦!


 qingzhou 回复于:2007-06-13 12:28:50

引用:原帖由 bjtzh 于 2007-6-13 10:54 发表
能否讲讲SAVE/RESTORE disk data??是在DST下的那个选项?它和COPY DISK UNITS有什么区别?这种方法和方案二有一些相似哦! 



Pls refer to the attachment to know how to restore os400 system thru backup data.

AS400 Restore System.rar


 hmilycbz 回复于:2007-06-13 15:48:27

偶采用的就是G4L的方案来进行的整盘备份:D


 lml2431 回复于:2007-06-14 10:36:37

惊暴12小时


 happy943 回复于:2007-06-14 15:51:59

asdfsdfasdf


 971726 回复于:2007-06-16 14:32:47

我在机器上做了测试(4318换4317),loadsource盘copy后关机拔出能正常IPL,其他4317盘copy后都“自动”从系统中(ASP)remove了,在系统里看到的是non configuration状态,数据都移到4318 了。  
    disk copy后系统都正常IPL,所以我认为bjtzh不应该拔出D12里的盘,而应该拔出D02的盘,然后将新盘插入D02再COPY,依此类推。 (也就是:loadsource盘要拔出更换,其他新盘COPY后就不要动位置 )

请高手回答我的理解是否正确!!!???


 fanbt 回复于:2007-06-23 23:10:20

想节省时间,反而花更多的时间,你想让人怎么说你呢?直接用方案三,慢是慢了点,却是最安全的……


 fanbt 回复于:2007-06-23 23:11:57

这样的帖也算精华?
班竹是在洗楼主脑壳吧~!!


 qingzhou 回复于:2007-06-25 21:54:46

引用:原帖由 fanbt 于 2007-6-23 23:11 发表
这样的帖也算精华?
班竹是在洗楼主脑壳吧~!! 


如果你也能写出这样的方案来,也给你加精华~~~ 

精华帖子未必都是个个经典,但存档必有它的存在价值和参考价值。


 aaniao999 回复于:2007-06-28 01:17:45

旧的硬盘和新的是一样的?
另外,为什么不是用GHOST(我指的是GHOST软件,DOS下的),而用RAID对烤
我没面对国这种为题,你们说的那方法也没玩国,我是新手,
大家麻烦跟我解释下吧,XX了


 ity521 回复于:2007-07-03 15:47:53

....400上我还没听过能用GHOST


 mbi 回复于:2007-07-03 17:30:35

我成功做过按方案一走的实施。
用8块140GB换掉8块70GB,很顺利,不过时间很长。从下午开始,做到晚上的3点。基本都在等。

关键是load source 盘拷贝过来后,能够启动机器。然后就相当于把数据从旧硬盘中倒到新硬盘中。

也没有心惊动魄,感觉给这个机器换血一样。

感觉不如果备份恢复来得快,不如重装,把数据倒回来。保证能恢复就可以了。




原文链接:http://bbs.chinaunix.net/viewthread.php?tid=948077
转载请注明作者名及原文出处



收藏本页到: