【故障处理】一次RAC故障处理过程

点多,一个网友喊我帮忙处理宕机不能启动的问题,并且告知涉及到多路径和存储的事。小麦苗对存储一向不太懂,多路径也没怎么接触,自己也没研究过这个东西。既然找到了我,那就不能不管啊,硬着头皮上去看看。结果悲催了,搞了个小时,求助了

的不能启动,报了一大堆的错误,节点的也不能正常启动。错误我忘记记录了,反正是各种研究日志,各种查,各种百度,各种,包括的还原都试了,最后没办法了,只有使用个人常用的绝招了,那就是。。。。。脚本

选项,但是没有该选项。在第二个节点上执行卸载的时候可以不用加

点熬到点了吧。结果在准备导入的备份的时候,需要以模式启动,结果又悲催了,集群坏掉了。没办法,只得重启,重启更悲催,的盘找不到了。小麦苗想放弃了。盘找不到,我更没办法了。只得找找懂存储的人来弄了。差不多

点多,睁眼就赶紧登,继续处理。首先捣鼓了半天的多路径。原来第二个节点的多路径软件有问题,自己就重新安装了一下。安装后期望能看到磁盘,结果还是不行。无奈,在

,然后。执行完后发现集群正常,自己尝试重启了一下主机,一切正常,看来就是存储搞得鬼。那就继续恢复数据库,这个是重点。由于整个操作过程都小心翼翼不敢动的数据什么备份都没有,我也是醉了。用看了一下磁盘,一切正常,好吧,那就接下来直接磁盘组。后只要磁盘组的磁盘文件没有损坏,那么就可以直接起来的。这也是在无备份情况下恢复

脚本特别需要注意的是数据库的数据是否放在磁盘组上。若放在

个节点分别执行

盘进行,

执行完后再在节点

版本执行有一个常见的

这条信息的时候执行

参数,那就去掉,可以用

【故障处理】一次RAC故障处理过程