RAC中一节点无法启动解决步骤
admin
2023-04-17 20:41:57
0

问题现象:一套两节点的RAC集群,其中节点2集群无法启动,ohas进程已经启动但CRSCSS进程未启动

1、首先查看

查看RAC中的alert日志,发现日志中一直在报如下报错:

file rotation terminated. log file: "/app/11.2.0.4/grid/log/uatdb02/client/olsnodes.log"

RAC中一节点无法启动解决步骤

从日志中可以看到提示说olsnodes.l03owner不是oracle

查看后发现确实用户属主有属组有问题

RAC中一节点无法启动解决步骤

修改文件属主和属组

chown root:root olsnodes.l03

修改后olsnodes.log可以被正常切割,alert日志也不再报这个错。但报错也就停止。没有日志如何继续往下查?

2、检查RAC的一些配置情况,由于对于RAC也只限于能够根据文档搭建成功,没有太多问题处理经验只能一边查问题一边查文档和MOS

先检查RACASM配置情况

RAC中一节点无法启动解决步骤

发现与以往搭建的RAC查看disk path输出的内容不同,于是想到是使用asmlib搭建的RAC

rpm -qa |grpe asm发现确实安装了相关包,说明推测方向正确

RAC中一节点无法启动解决步骤

以前都是通过UDEV的方式配置RAC的ASM共享磁盘,asmlib的方式没有用过。于是从网上找了相关的帖子查看,并找到一些命令。

oracleasm scandisks

oracleasm listdisks

但是知道这些命令还是没有办法解决问题。

尝试执行上面的命令看看输出结果

发现在scandisks时出现permission denied on OCR1的提示

于是感觉有了一个方向,是不是共享盘的权限访问导致的呢

找到共享盘的目录/dev/oracleasm/disks查看

RAC中一节点无法启动解决步骤

节点2属主和属组都是root,如果是权限有问题,那正确的权限有又该是什么呢,好在节点1还在正常的跑着,查看节点1 的共享磁盘

RAC中一节点无法启动解决步骤

从上面的查看来看,正常结点的属主为grid,属组为asmadmin,是不是由于这个原因导致集群无法启动的呢?

尝试手动修改节点2的属主和属组

RAC中一节点无法启动解决步骤

这里漏掉了对权限做修改。。。

修改后尝试重启节点2的集群

crsctl start crs

报错提示ohas已启动,crs启动失败

仔细阅读crsctl start使用说明才发现start crs是启动OHAS的命令,start cluster 才是启动CRS的命令。看来还是对RAC的了解不够深入呀。。。

RAC中一节点无法启动解决步骤

再次尝试启动节点2集群

RAC中一节点无法启动解决步骤

提示cssd启动失败,从alert日志中也可以看到如下报错

RAC中一节点无法启动解决步骤

于是查看ocss.log

RAC中一节点无法启动解决步骤

ocss日志中输出的报错可以看出来是无法找到vote disk,集群自然是无法启动的。

但是为什么找不到磁盘,原因还不知道。于是救助于MOS,但查了十几篇有相关关键字的文档,与这里的问题又不太相似。也没有可用的解决办法。

于是问题限入了僵局。

下班时间到了,第二天接着搞。

第二天登录机器再次尝试crsctl start cluster(明知没有,但还是想试一下,侥幸心理。。)

果然没有辜负我,依然报错找不到vote disk

MOS文档查到一些相关命令

crsctl query css votedisk

在节点2中无输出内容,节点1有。

kfod status=TRUE asm_diskstring='/dev/oracleasm/disks/*' disks=ALL

节点1很快能返回

RAC中一节点无法启动解决步骤

但节点2hang

RAC中一节点无法启动解决步骤

而且可以看到节点2的共享盘,权限又变回root了,于是又再次手动修改,(心想也不能每次重启机器都手动修改这个吧)

RAC中一节点无法启动解决步骤

再次执行上面的命令

RAC中一节点无法启动解决步骤

出现有报错。

突然想到是不是两个节点的asmlib的配置不同导致的,由于对asmlib不熟悉,从网上帖子上看到的都是配置asmlib的,不知道如何查看配置

尝试执行oracleasm configure,发现两个节点的配置确认不一致

RAC中一节点无法启动解决步骤

RAC中一节点无法启动解决步骤

ORACLEASM_UID GID配置有问题

于是进行修改

RAC中一节点无法启动解决步骤

查看状态

RAC中一节点无法启动解决步骤

修改完成,在scandisks时没有提示permission denied,感觉应该没有问题了

再次尝试启动crs

crsctl start cluster

启动成功

RAC中一节点无法启动解决步骤

RAC中一节点无法启动解决步骤

至此集群问题解决。但从状态来看这套RAC集群还是存在很多的问题。

总结:加深对RAC的理解,各组件的作用。各命令的含义。


相关内容

热门资讯

美参议院投票批准凯文·沃什出任... △凯文·沃什(资料图)当地时间5月12日,美国参议院投票批准凯文·沃什出任美联储主席,目前相关投票程...
缺油!日本快撑不住了 日本零食巨头卡乐比为节省油墨竟将原本漂亮的包装改成了黑白两色,从“喜食”变得看上去像“丧食”。日本石...
英国首相斯塔默再遭逼宫,在内阁... 【文/观察者网 熊超然】在上周经历地方选举惨败后,作为执政党领袖的英国首相斯塔默于当地时间5月11日...
日防相声称:新西兰考虑进口日本... 据凤凰卫视报道,5月12日,日本防卫大臣小泉进次郎在记者会上表示,新西兰已将日本海上自卫队最上型改良...
小米YU7 GT“车厘子红”无... 5 月 12 日消息,博主 @王的男人、昨日晒出了小米 YU7 GT「车厘子红」实车照片。画面显示,...
中关村论坛重磅发布!大兴机场临... 3月27日,在中关村论坛数据跨境流动创新发展论坛上,北京大兴国际机场临空经济区(大兴)正式发布跨境可...
白宫公布随特朗普访华16位商界... 白宫11日公布了将随特朗普一同访华的商界领袖名单。据多家美媒报道,总共将有16位美国商界代表来到北京...
荣耀申请代码生成方法专利,提高... 国家知识产权局信息显示,南京荣耀软件技术有限公司申请一项名为“代码生成方法、电子设备及存储介质”的专...
凤凰连线:中美新一轮经贸磋商,... 中美双方将在韩国举行第七轮经贸磋商。美方的阵容和日程安排如何?在这轮磋商中有哪些关切?凤凰卫视驻韩国...
知情人士:阿联酋秘密打击伊朗,... 据参考消息援引美国《华尔街日报》网站5月11日报道,多名知情人士透露,阿联酋已对伊朗发动军事打击,令...