private 网络不稳定引起的Evicting instance 2 from cluster
admin
2023-04-26 00:22:12
0

环境:双节点RAC, oracle 11.2.3

客户电话RAC实例2异常,现场查看日志:

实例2:

Fri Aug 25 09:45:16 2017

Received an instance abort message from instance 1Received an instance abort message from instance 1


Please check instance 1 alert and LMON trace files for detail.Please check instance 1 alert and LMON trace files for detail.


LMS0 (ospid: 24510820): terminating the instance due to error 481

Fri Aug 25 09:45:16 2017

System state dump requested by (instance=2, osid=24510820 (LMS0)), summary=[abnormal instance termination].

System State dumped to trace file /oracle/11.2.0/diag/rdbms/ins/ins2/trace/ins2_diag_21561818.trc

Instance terminated by LMS0, pid = 24510820

实例1

Fri Aug 25 09:44:25 2017

IPC Send timeout detected. Sender: ospid 35783054 [oracle@db1 (LMS1)]

Receiver: inst 2 binc 2073329022 ospid 24183072

IPC Send timeout to 2.2 inc 28 for msg type 65518 from opid 14

Fri Aug 25 09:44:27 2017

Communications reconfiguration: instance_number 2

Fri Aug 25 09:45:16 2017

Detected an inconsistent instance membership by instance 1

Evicting instance 2 from cluster

Waiting for instances to leave: 2 

Fri Aug 25 09:45:16 2017

Dumping diagnostic data in directory=[cdmp_20170825094516], requested by (instance=2, osid=24510820 (LMS0)), summary=[abnormal instance termination].

Reconfiguration started (old inc 28, new inc 32)

List of instances:

 1 (myinst: 1) 

查看/oracle/11.2.0/diag/rdbms/gjj/ins2/trace/ins2_diag_21561818.trc

*** 2017-08-25 14:24:35.900

I'm the voting node

Group reconfiguration cleanup

confirm->incar_num 22, rcfgctx->prop_incar 0

Send my bitmap to master 0

kjzgmappropose : incar 0, newmap - 

3000000000000000000000000000000000000000000000000000000000000000

kjzgmappropose : rc from psnd : 30

kjzdattdlm: Can not attach to DLM (LMON up=[TRUE], DB mounted=[FALSE]).

kjzdattdlm: Can not attach to DLM (LMON up=[TRUE], DB mounted=[FALSE]).

怀疑心跳网络存在问题(这套RAC之前就出现过几次实例被驱逐的问题,但实例自动都启动了,这次实例被驱逐后实例2不能启动,针对之前实例被驱逐的问题进行过参数修改,通过这次的情况来看,实该不是参数设置的问题)。

测试心跳网络,连通性和传输速率都没有问题,后续打算通过haip进一步提升心跳网络可用性,在添加haip过程中发现当服和服务器和交换机新添加网络后出来数据包丢失的情况,丢包率50%,判断心跳网络稳定性存在问题,基于此撤掉新添加的心跳线,更换原来的心跳线,重启被驱逐的实例2,实例正常。

最后判断是原心跳线RJ45头存在某两芯短路的问题造成此次故障。

相关内容

热门资讯

卫生间水管布置图尺寸高度 卫生间的水管布置可能比较复杂一些,因为卫生间的管道比较多。比如有热水器的通水管道,有座便器的冲水管道...
电脑尺寸在哪里看 电脑尺寸在哪里看1、可以选择手工测量法来测量电脑尺寸,这时测量一下屏幕对角线,因为显示面积都会小于显...
电脑机箱尺寸标准 常规的机箱一般是立体式,或桌面式,再就是横式。电脑机箱尺寸,目前市面上根据不同的规格有不同的方案。 ...
斯塔默发声:不会辞职 【环球时报驻英国特约记者 纪双城 环球时报特约记者 甄翔 于文】执政党工党在英国地方选举中遭遇“历史...
抽油烟机管道有异味怎么办 抽油烟机是厨房中不可或缺的设备,它能有效地排出油烟,保证室内空气的清新。但是,长时间使用后,抽油烟机...
抽油烟机管道有油垢怎么办 抽油烟机管道是我们家庭生活中必不可少的设备,但长时间的使用会导致管道内部积累大量的油垢,如不及时清理...
沈伯洋与台北市长格局有落差,叶... 海峡导报综合报道 民进党将正式拍板征召民代沈伯洋出战台北市长,并发布采访通知,预计在13日下午举行台...
核查:上世纪已有多款汉坦疫苗上... 明查员 冯梦速览- 人类感染汉坦病毒已有数十年历史。朝鲜战争期间,联合国军就曾有过大规模感染。汉坦病...
如何从“一证在手”走向“一技傍... 教员在给学员讲解理论知识。 学员在进行无人机试飞训...
内蒙古自治区党委金融工作委员会... 内蒙古自治区党委金融工作委员会副书记马保国涉嫌严重违纪违法,目前正接受内蒙古自治区纪委监委纪律审查和...