OGG目标端复制Sequence时Hang住的问题
admin
2023-05-28 10:41:53
0

昨天遇到一个问题一个OGG的复制进程在复制序列(Sequence)时Hang住不动,进程状态一直是Running状态但是不往前进行复制,导致进程延迟6个多小时

GGSCI (ctm-3) 2> info all

Program     Status      Group       Lag at Chkpt  Time Since Chkpt

MANAGER     RUNNING                                           
REPLICAT    RUNNING     USIM        00:13:39      06:50:22

操作复制进程时,stats和stop显示操作超时,只能kill进程,重启复制进程问题依就。问题从下午一直持续到晚上7点多,实在没有办法把所有数据都全部初始化了,还是不行,好在数据量不大。最后把goldengate用户赋予dba权限问题就解决了,但是GOLDENGATE用户的权限分配问题依然还是一个问题。下面记录了问题的处理过程,有兴趣的朋友可以看看。

使用view report usim查看日志,日志停在一个复制Sequence的语句上

Wildcard MAP resolved (entry USIM.*):
  map "USIM"."SEQ_PROCESSSTEP", target USIM."SEQ_PROCESSSTEP";
Resolving target sequence USIM.SEQ_PROCESSSTEP.

查看ggserr.log也没有报错信息。

于是查看数据库里的会话

SYS@ctm> select sid,serial#,LOGON_TIME,MODULE,sql_id,prev_sql_id,event,blocking_session from v$session where MODULE like '%USIM%';

       SID    SERIAL# LOGON_TIME   MODULE                         SQL_ID        PREV_SQL_ID   EVENT                          BLOCKING_SESSION
---------- ---------- ------------ ------------------------------ ------------- ------------- ------------------------------ ----------------
       764       8229 20-JAN-17    OGG-USIM-OPEN_DATA_SOURCE      awjuqsu6bk5d4 b6zg67dtg1q14 row cache lock
       
SYS@ctm> select sql_text from v$sql where sql_id='awjuqsu6bk5d4';

SQL_TEXT
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
SELECT "SEQ_PROCESSSTEP".NEXTVAL FROM DUAL

SYS@ctm> select sql_text from v$sql where sql_id='b6zg67dtg1q14';

SQL_TEXT
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
SELECT HIGHWATER FROM SYS.SEQ$ WHERE OBJ#=:B1

看到当前ogg的复制进程在执行SELECT "SEQ_PROCESSSTEP".NEXTVAL FROM DUAL的语句,进程是在等待row cache lock。上面贴出来的是晚上查询时的情况,其实下午在查这条sql时是不同的一个序列名字,但是动作一样都是select nextval from dual,但是等待事件有library cache: mutex X、cursor: pin S wait on X、latch free、latch: shared pool。

看到这些等待事件头都大了,先到百度上去搜索,看到有帖子说有可能是BUG,然后又到MOS上去搜等待事件的组合,看到很多BUG的文章,但是描述跟现在遇到的情况不一致。于是又转到搜goldengate和序列hang的关键字,搜到一篇http://m.blog.csdn.net/article/details?id=48544207,在MOS上搜到1331998.1和1535322.1,但都是跟现在的情况不符。

于是又无奈的去查官方文档,在Oracle GoldenGate Oracle Installation and Setup Guide中查到下面的几句话:

OGG目标端复制Sequence时Hang住的问题

看到红框中的那句后恍然想到,由于系统交维,要求不允许用户有DBA角色,GOLDENGATE也不可以,于是查看GOLDENGATE用户的角色

SYS@ctm> select granted_role from dba_role_privs where grantee='GOLDENGATE';

GRANTED_ROLE
------------------------------
RESOURCE
CONNECT
SELECT_CATALOG_ROLE

果然没有DBA角色,那问题是不是出在这里呢,于是尝试给GOLDENGATE用户DBA角色

grant dba to goldengate;

kill掉hang住的会话,重启复制进程usim,终于问题解决了。复制进程开始往下复制了,而且序列复制的很快

GGSCI (ctrm-r3) 20> stats usim hourly

Sending STATS request to REPLICAT USIM ...

Start of Statistics at 2017-01-20 21:47:22.

DDL replication statistics:

*** Total statistics since replicat started     ***
        Operations                                         0.00
        Mapped operations                                  0.00
        Unmapped operations                                0.00
        Other operations                                   0.00
        Excluded operations                                0.00
        Errors                                             0.00
        Retried errors                                     0.00
        Discarded errors                                   0.00
        Ignored errors                                     0.00

Replicating from USIM.SEQ_PROCESSSTEP to USIM.SEQ_PROCESSSTEP:

*** Hourly statistics since 2017-01-20 21:46:06 ***
        Total updates                                     16.00
        Total discards                                     0.00
        Total operations                                  16.00

End of Statistics.

最后再回想,难道就真的是因为DBA角色的关系么?于是把GOLDENGATE用户的DBA角色收回:revoke dba from goldengate;

再次观察复制进程情况,竟然正常在复制,没有受到影响。而且从昨晚10点多回收dba角色,到今天发博客,复制进程也没有hang住,还在正常复制。这就回到了上面疑问,真的是因为DBA角色导致的么?现在还不清楚。如果哪位大神知道问题的原因可以在博客中回复,感激不尽。

相关内容

热门资讯

又一大厂裁员8000人!员工连... 智东西 编译 | 佳扬 编辑 | 云鹏 智东西5月20日消息,据纽约时报报道,Meta 8000人裁...
三星罢工危机暂解,加薪6.2%... 三星电子在最后关头与工会达成初步协议,避免了一场可能严重冲击全球内存芯片供应链的大规模罢工。对于正处...
马办与调查小组撕破脸,李德维称... 马英九指控基金会前执行长萧旭岑、王光慈破坏财政纪律,并指派基金会董事组成三人小组调查,但基金会数度指...
潮涌伊滨向“新”行 魏书生中学的“AI创想家”未来教室。伊滨宣供图钢制家具智能化生产场景。张若含 摄宁德时代洛阳基地。张...
河南尉氏县多人呕吐腹泻,当地成... 极目新闻记者 王鹏近日,河南开封尉氏县多位网友发视频称,当地有不少居民出现呕吐、腹泻的情况,视频画面...
全自动洗衣机应该咋清洗 全自动洗衣机应该咋清洗可以将洗衣机排水管拿下放在一个空水桶上,然后关闭进水阀门和前门,将三水壶用量的...
微波炉怎么清洗? 微波炉的外观清洁非常简单,平时勤用抹布擦拭就可以了。微波炉里面太脏,不需要用洗洁精擦洗,简单到家清洗...
秋季冰箱调到什么档位最合适 一般情况下秋季冰箱调到2~3档是最合适的,也就是说在这个季节冰箱的冷冻室温度需保持在-18℃以下,而...
冰箱档位1凉还是7凉 对于大多数的冰箱来说,温度从1档位到7档位是逐渐降低的,当然制冷效果也是逐渐地增强的,所以也就是说档...
冰箱保鲜的档位12345 哪个... 冰箱保鲜的档位通常表示温度的高低,数字越大,温度越低,制冷效果越好。因此,5 档通常是最冷的档位。然...