[转帖]tuxedo故障BBL挂死_MQ, Tuxedo及OLTP讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  MQ, Tuxedo及OLTP讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 4122 | 回复: 0   主题: [转帖]tuxedo故障BBL挂死        下一篇 
linjun
注册用户
等级:中校
经验:2221
发帖:176
精华:2
注册:2013-1-6
状态:离线
发送短消息息给linjun 加好友    发送短消息息给linjun 发消息
发表于: IP:您无权察看 2013-1-9 9:23:25 | [全部帖] [楼主帖] 楼主

今天11:00~12:00之间weblogic 程序告警weblogic端线程100基本耗光,剩余10个左右,发现同是链接到一个tuxedo出现的问题,tuxedo中间件再次出现问题,登入tmadmin,显示无BBL存在,但ps 看还有BBL进程,但已不能在tmadmin下执行命令;

沟通bea工程师,还是采取老王的办法。bea工程师的建议是:

1) tuxedo一直使用Tuxedo 8.1 for AIX4.3.3版本,建议使用tuxedo 8.1 for AIX 5.2版本,打上补丁Rp357。

2) 目前应用是在Tuxedo 8.1 for AIX4.3.3 RP243上编译,建议在tuxedo 8.1 for AIX 5.2 RP357上重新编译。  后续待观察,有结果再更新。

升级以后发现由于服务core掉导致的BB被破坏已经基本恢复,营业也是只编译了相关的库文件。但是BB也出现由于core 被破坏的现象,服务也经常core 掉,于是觉得应用由多线程改为单线程去掉参数THREADSTACKSIZE =  1048576 ,然后重新启动。同时增加参数 ,设置环境变量如:LDR_CNTRL=MAXDATA=0x80000000 然后重启GWTDOMAIN.通过监控发现,GWTDOMAIN出现内存分配错误时占用内存已经达到上限256m(应用的maxdata为8,可以使用2G)。而GWTDOMAIN处理一个消息最大需要15倍消息大小的内存(用于编码\解码、压缩\解压、加密\解密等操作)。在关闭大报表之后,目前没有出现问题,但还是有些GWTDOMAIN 的占用内存接近上限以及丢弃消息现象。

根据上述信息:

1)建议为GWTDOMAIN建立独立的启动脚本,启动GWTDOMAIN之前增加环境变量:LDR_CNTRL=MAXDATA=0x20000000 (即最大可以使用512m内存,今后根据监控情况再调整)

2)经运行监控脚本,当监控到GWTDOMAIN分配内存失败,自动重起GWTDOMAIN

暂时没发现后台服务频繁的core 掉。后续观察更新中。

目前生产已经使用LDR_CNTRL=MAXDATA=0x40000000最大分配内存1G。这个可以处理返回的数据大小大约为最大15倍,但是看到目前的情况没有编码解码的情况下,一般是8倍左右,那就是说1G/8=150M 的数据。即tuxedo 可以反馈150M的数据给前台处理,但是前台内存块大小不够这么大的,所以javacore 产生,鉴于此情况,准备调整此参数为 LDR_CNTRL=MAXDATA=0x20000000  512M内存.

处理方法为:

tmshutdown -s GWTDOMAIN
LDR_CNTRL=MAXDATA=0x20000000
tmboot -s GWTDOMAIN


在javacore 里面发现日志cache了很大的数据到300M,所以调整参数domain--->Configuration--->General Console Log Buffer Handler Cache Size 为0.即。不记录在缓存中条数。




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论