[原创]Tuxedo错误日志分析实例_MQ, Tuxedo及OLTP讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  MQ, Tuxedo及OLTP讨论区 »
总帖数
2
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 8133 | 回复: 1   主题: [原创]Tuxedo错误日志分析实例        下一篇 
yang.liu
注册用户
等级:少校
经验:1182
发帖:77
精华:1
注册:2014-1-3
状态:离线
发送短消息息给yang.liu 加好友    发送短消息息给yang.liu 发消息
发表于: IP:您无权察看 2014-4-4 17:05:15 | [全部帖] [楼主帖] 楼主

1.概述

分析XX系统tuxedo出现问题时候的日志。

2.系统当前配置

Tuxedo 8.1 on HP-UX 11


3.日志分析

1)执行时间较长的service

113日监控tuxedo的运行情况,总体运行比较稳定,不过有执行时间比较长的serviceblpncpolicy。如下所示:6402对应的server一直在运行blpncpolicy,而且rqdone数目并没有增加。

> psr  -i 6402
Prog Name      Queue Name  Grp Name      ID RqDone Load Done Current Service
---------      ----------  --------      -- ------ --------- ---------------
blpncpolicy_cs blpncpolic+ blprpp      6402   9838    491900 blpncpolicy
> psr  -i 6402
Prog Name      Queue Name  Grp Name      ID RqDone Load Done Current Service
---------      ----------  --------      -- ------ --------- ---------------
blpncpolicy_cs blpncpolic+ blprpp      6402   9838    491900 blpncpolicy
> psr  -i 6402
Prog Name      Queue Name  Grp Name      ID RqDone Load Done Current Service
---------      ----------  --------      -- ------ --------- ---------------
blpncpolicy_cs blpncpolic+ blprpp      6402   9838    491900 blpncpolicy
> psr  -i 6402
Prog Name      Queue Name  Grp Name      ID RqDone Load Done Current Service
---------      ----------  --------      -- ------ --------- ---------------
blpncpolicy_cs blpncpolic+ blprpp      6402   9838    491900 blpncpolicy


2) 因执行时间超时而停止的服务

125549.server_1!BBL.20327: CMDTUX_CAT:1667: WARN: Server(28501) processing terminated after SVCTIMEOUT
125549.server_1!BBL.20327: LIBTUX_CAT:541: WARN: Server blprpc/103 terminated


3)无法调用信号量的错误

50848.server_1!WSH.21190: LIBTUX_CAT:752: ERROR: semop system call failure for semaphore 393257, errno 36
150848.server_1!dbprpo_csvr.20651: LIBTUX_CAT:752: ERROR: semop system call failure for semaphore 393257, errno 36
150848.server_1!blutil_asvr.20693: LIBTUX_CAT:752: ERROR: semop system call failure for semaphore 393257, errno 36
150848.server_1!blpncpolicy_csvr.20914: LIBTUX_CAT:752: ERROR: semop system call failure for semaphore 393257, errno 36
150848.server_1!blutih_asvr.20466: ERROR: msgrcv err(LIBTUX_CAT:666: ERROR: Message operation failed because the queue was removed):
errno=36,qid=35652042,buf=1074273000,bytes=1411,type=-1073741824,flag=0


4)在个server中有tpreturn message send blocked, will try file transfer

的现象

blpncpolicy_csvr.20915: LIBTUX_CAT:1285: WARN: tpreturn message send blocked, will try file transfer
blprpj_csvr.23782: LIBTUX_CAT:1285: WARN: tpreturn message send blocked, will try file transfer


4.内核参数

操作系统中内核参数:msgmnb16K

5.分析建议

1)在service blpncpolicyblprpc中添加时间戳,以便确定执行时间长的具体原因。也可暂时在ubb配置文件中增加blprpc的执行时间限制

2)从日志中无法调用信号和tpreturn message send blocked, will try file transfer以及对应内核参数msgmnb的值来看,建议增大msgmnb的值为512K




赞(0)    操作        顶端 
koei
版主
等级:大校
经验:4186
发帖:7
精华:0
注册:2011-7-21
状态:离线
发送短消息息给koei 加好友    发送短消息息给koei 发消息
发表于: IP:您无权察看 2014-5-7 8:18:29 | [全部帖] [楼主帖] 2  楼

msgmnb的16K应该是系统默认值,一个跑Tuxedo的系统,没有调过IPC,也是很罕见的 :-)



赞(0)    操作        顶端 
总帖数
2
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论