资讯专栏INFORMATION COLUMN

OGG故障处理事记

IT那活儿 / 1875人阅读
OGG故障处理事记
一. 故障背景

记一次出账期间,日常稳定的OGG突然出现告警异常抽取进程异常,无法自动拉起,有历史的长事务无法解决。


二. 分析过程

查看异常进程日志view report name 可知,无法找到序列号89241的归档日志,看到这个,首要想的就是直接查看数据库的归档应用情况,以及现有保留的归档序列号,发现已经被删除,ADG没有同步到,自然到主库上找到,然后传输,注册再重新应用就OK。

但事情远远没有想象中处理的那么顺利,应用完归档后,重启抽取进程,启动后异常无法停止,只能强制停止了send name,forcestop

和原厂工程师确定,只要长事务中不涉及到抽取表的操作,可以在OGG端提交该事物或跳过该事物,根据日志中的Long Running Transaction: XID 1253.22.58349755  在源端数据库中确定SQLID

在此贴上SQL方便需要的兄弟续使用

set lines 300 pages 1000
col program for a30
col SCHEMANAME for a10
col machine for a35
col progran for a45
select s.inst_id,t.ADDR,
t.start_time,s.sid,s.serial#,nvl(s.sql_id,s.prev_sql_id) sql_id,s.machine,s.program,s.schemaname,s.status
from gv$transaction t,gv$session s
where t.addr=s.taddr and t.INST_ID=s.INST_ID
and t.xidusn in (1253) and t.xidslot in (22) and xidsqn in (58349755);

跳过之后重启,恢复正常,但恢复一段时间,发现队列文件没有增长,而且应用序列号也没有变换,stats统计信息也是原地不动,尝试多次重启,生成了多个队列文件但仍然没有增长,不明所以。

查询资料发现是存在需要恢复的长事务,这种情况需要看showtrans

info name,showch

根据Recovery checkpoint找到事务ID,是一个月前的长事务,跟踪sql信息后,发现是可以跳过的。send extract name,skiptrans 1079.8.71844665 后重启抽取进程,队里文件开始正常增长。


三. 故障总结

此次事故的主要原因还是因为在以前进程重启后出现长事务没有处理,导致后面故障重启出现多次长事务恢复需求,幸运的是和涉及的长事务和抽取的表没有关系,否则只能丢数据了。未避免这种情况的再次发生,我们针对OGG长事务进行监控,确保在归档保留周期外的长事务能第一时间处理,同时在存储条件有限的情况下,对归档的保留周期做了延期,让自己有充足的时间去处理。

END


更多精彩干货分享

点击下方名片关注

IT那活儿

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/129858.html

相关文章

  • DBASK问答集萃第四期

    摘要:问题九库控制文件扩展报错库的扩展报错,用的是裸设备,和还是原来大小,主库的没有报错,并且大小没有变,求解释。专家解答从报错可以看出,控制文件从个块扩展到个块时报错,而裸设备最大只支持个块,无法扩展,可以尝试将参数改小,避免控制文件报错。 链接描述引言 近期我们在DBASK小程序新关联了运维之美、高端存储知识、一森咖记、运维咖啡吧等数据领域的公众号,欢迎大家阅读分享。 问答集萃 接下来,...

    SKYZACK 评论0 收藏0
  • 2021年8月国产数据库大事记

    摘要:本文整理了年月国产数据库大事件和重要产品发布消息。柏睿数据库加速安全卡面向全球重磅发布。月日,在全球数字经济大会成果发布会上,中国移动北京分公司与国产数据库领域新锐企业柏睿数据签署战略合作协议。本次大赛主要面向全国爱好数据库的高校学生。 本文整理了2021年8月国产数据库大事件和重要产品发布消息。目录8月国产数据库大事记TOP108月国产数据库大事记时间线产品/版本发布兼容认证8月排行榜新增...

    Scorpion 评论0 收藏0
  • 公司大事记-jQuery跟踪切换

    摘要:需要实现的效果如下图总是显示最新一个年份的列表,每次显示个年份列的列表手机个手机显示如下列表上鼠标也可以切换,两个箭头同样可以切换。 需要实现的效果如下图: showImg(https://segmentfault.com/img/bVc9Oc); 总是显示最新一个年份的列表,每次显示10个年份列的列表(手机4个)showImg(https://segmentfault.com/...

    Dean 评论0 收藏0

发表评论

0条评论

IT那活儿

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<