第一章 摘要
此文档详细记录了XXX局YYY系统在2013年12月10日在10:17左右发生的应用访问异常问题,以及整个问题的分析处理全过程。
第二章 故障分析
2.1 故障系统
系统名称 营销系统
IP地址 ...
域名 ...
集群server AdminServer(admin)
监听地址、端口 ...:7001
Jvm配置 -Xms4096m -Xmx4096m
2.2 故障表象描述
根据客户描述,营销系统是在2013年11月10日上午10:17分左右应用系统出现异常,控制台页面和应用页面都无法登陆。
2.3 故障处理过程
时间点
过程描述
2013年11月3日
9:22左右
客户访问营销系统时,系统登陆异常。
10:00左右
厂家发现问题是由于归档日志写满导致,整理归档日志后,重启应用,系统出现异常。
10:17左右
收到专责的电话,远程查看故障。
10:21左右
重启weblogic Server 引用回复正常。
10:31左右
经客户查看系统恢复正常。
2.4 故障影响
此故障涉及系统为人资系统,系统使用较少,并且在一小时内处理完成,故障影响较小。
2.5 分析过程
通过沟通了解到,厂家在处理完归档日志后,在连接池未回复正常的情况下,进行应用服务的重新启动,并且在段时间内重启大量服务,并未依次重启,导致系统进入繁忙状态,无法正常运行。
第三章 故障原因
Weblogic进入繁忙状态。
第四章 解决方案
重启weblogic。
第五章 总结
在操作weblogic时,要按照操作规范进行,依次进行,尽量不要同时进行多个消耗资源的操作,尤其是在部分功能处于故障的情况下,建议应用厂家规范weblogic操作。
该贴被funny编辑于2014-3-4 14:35:07该贴被funny编辑于2014-3-4 14:36:10