[转帖] WebLogic JRockit的使用和性能调优_Tomcat, WebLogic及J2EE讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Tomcat, WebLogic及J2EE讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3116 | 回复: 0   主题: [转帖] WebLogic JRockit的使用和性能调优        下一篇 
mingrui.li
注册用户
等级:少校
经验:1356
发帖:95
精华:11
注册:2013-1-4
状态:离线
发送短消息息给mingrui.li 加好友    发送短消息息给mingrui.li 发消息
发表于: IP:您无权察看 2013-1-7 9:26:46 | [全部帖] [楼主帖] 楼主

一.JRockit调优简介
JRockit是一个自适应的JVM,它能够自动调整自己去适应底层硬件,因此对它的调优主要集中在一些需要人工干预的参数上,比如说:需要划分多少RAM给JRockit使用等。JRockit有一组非标准的-X启动选项,我们可以用它来调节JVM。JRockit有两组主要的子系统可以被优化--内存管理系统(包括垃圾回收)和线程系统。在内存管理子系统方面,有很多调优的工作可以做。

二.Tuning WebLogic JRockit JVM
1.设置初始堆尺寸
可以通过-Xms:<size>m来设置初始堆大小,如果-Xmx的值小于128MB,则-Xms缺省取值为16MB;如果-Xmx设置大于 128MB,则-Xms缺省值为物理内存的25%,最大不超过64M。例子:

-Xgc:gencon -xms:64m -Xmx:64m myClass


2.设置最大堆尺寸
可以通过-Xmx:<size>m来设置最大堆尺寸。在IA32构架下,由于操作系统给每个进程的最大内存寻址空间为1.8G,因此最大堆尺 寸不能超过1.8G。在IA64构架下,就没有1.8G的限制。
如果你的JAVA应用程序在运行时出现了Out of memory的错误,你就需要调大最大堆尺寸。如果没有设置最大堆尺寸,则缺省值为:
1. 如果设置了-Xgc:gencopy,由最大堆尺寸是min{400, 物理内存*75%};
2. 如果没有设置-Xgc:gencopy,由最大堆尺寸是min{1536, 物理内存*75%};
最好手工把最大堆尺寸设置为物理内存(1024M)的75%:

-Xgc:gencon -xms:64m -Xmx:768m myClass


3.设置Nursery的尺寸
可以使用-Xns:<size>来设置Nursery的尺寸,我们要在保证垃圾回收停顿时间(garbage collection-pause)尽可能短的同时,尽量加大Nursery的尺寸,这在创建了大量的临时对象时尤其重要。缺省值为:
1. ��于-Xgc:gencopy,缺省的Nursery大小为320KB/CPU,对于10个CPU的系统来说,Nursery大小为3200KB(3.2M)
2. 对于-Xgc:gencon,缺省的Nursery大小为10M/CPU,对于10个CPU的系统来说,Nursery大小为100M
4.定义内存空间的清理时机
可以使用-Xcleartype:<gc|local|alloc>来定义已经被垃圾回收的内存空间在什么时候可以被清理,支持以下三种方式:
1. gc,在垃圾回收的同时清理内存;
2. local,在分配了一块thread-local区域时清理内存,仅在把参数-Xallocationtype设置成local时才有用;
3. alloc,在这块内存被分配给其它对象时清理。在IA64上目前还不支持。
缺省值为:
1. IA32上缺省值为alloc
2. IA64上缺省值为gc
5.定义线程分配的类型
可以使用-Xallocationtype:<global|local>来定义线程分配的类型。
1. global,在最大堆尺寸比较小时(小于128M)或者应用程序大量使用了线程时使用。
2. local,在最大堆尺寸比较大时(大于128M)或者应用程序少量使用了线程时使用。
缺省值:
1. 如果设置了-Xgc:gencopy,缺省值为global
2. 如果设置了-Xgc:siglecon,-Xgc:gencon和-Xgc:parallel,缺省值为local
6.定义线程栈尺寸
可以使用-Xss<size>[k|K][m|M]来定义线程栈大小。最小线程尺寸定义如下:
1. thin threads:最小线程栈尺寸为8K,缺省为64K;
2. native threads:最小线程栈尺寸为16K
如果-Xss设置小于最小值,则自动使用最小值。
缺省值:
1. IA32系统,WIN32:64K,LINUX32:128K
2. IA64系统,WIN64:320K,LINUX64:1M
二.Basic Tuning Tips and Techniques
尽管JRockit提供了一组缺省的OOTB配置选项,但最好根据实际应用情况来对JRockit作一些调整。
1.决定你要在哪方面调优
要考虑的因素有:
1. 要为JRockit分配多少内存空间;
2. 你要调优的目���是什么,是要得到更好的响应性还是更好的性能;
2.设置堆尺寸
对于堆尺寸来说,当然是越大越好了。如果设得不够大,就会造成Out-of-memory和内存分页错。如果同时运行了多个应用程序,建议把最小和最大堆尺寸设置成一样大。
3.在高响应性方面的调优
要得到更好的响应性能,应该设置
1. 使用并发垃圾回收器。-Xgc:gencon
2. 设置初始和最大堆大小。-Xms512m,-Xmx768m,由于使用了并发垃圾回收器,所以堆大小不会造成长时间的等待。
3. 设置nursery尺寸。如果用到了大量的临时对象,则需要适当的调大nursery尺寸。调大nursery尺寸会导致垃圾回收的停顿时间加长,因此要 注意,确保垃圾回收的停顿时间在可忍受的范围内,这个停顿时间可以通过设置-Xgcpause来查看。
4.在高性能方面的调优
如果要得到更好的性能,你应该:
1. 选用并行垃圾回收器,由于并行垃圾回收器不使用nursery,因此你不必再设置-Xns,方法是加上-Xgc:parallel
2. 把初始和最大堆尺寸设置调到尽可能的大。方法是-Xms512m, -Xmx768m。
5.分析垃圾回收和停顿时间
1. 使用-Xgcreport生成报表,显示垃圾回收的统计信息,从中可以看出你是不是最有效地使用了垃圾回收器。
2. 使用-Xverbose:memory来显示在运行期间每一次垃圾回收的停顿时间。本选项仅用于调试,会产生大量的控制台输出。
6.调整线程选项
当大量地使用了线程时(超过100个),需要调整线程选项:
1. 使用thin线程选项。-Xthinthreads。瘦线程模式在LINUX下非常有效。注意:瘦线程在JRockit中只是一个试验选项,不推荐广泛使用;
2. 关闭本地分配线程的选项。-Xallocationtype:global。每个本地线程区都要消耗大约2K的内存,如果大量地使用了线程,本地线程不但 会造成内���空间浪费,而且还会造成堆碎片。使用全局线程机制会减少堆碎片,但在内存分配方面速度要慢一些。
7.分析并改善应用程序设计
找出瓶颈方法:
1. 使用Intel VTune工具;
2. 使用-Xjvmpi:allocs=off,monitors=off,entryexit=off选项。
三.Command Line Options by Name
启动JRockit时,可以带一些-X选项,这些选项是非JVM标准的,专门用于配置JRockit的性能。
选项 描述
-X显示扩展Java选项

-Xallotype


-Xallocationtype可取值global和local,定义使用本地线程还是全局线程。
-Xbootclasspath指定类搜索路径,可以是ZIP和JAR文件,以;或:分隔
-Xcleartype定义内存清理时机,可取值gc, local, alloc。gc表示在垃圾回收时清理内存;local表示时分配一块local线程区时清理;alloc表示内存区要被分配给其它对象时清理
-Xgc选择要使用的垃圾回收器的类型,可取值:

gencopy:generational copying


singlecon:single spaced concurrent,单空间并发

gencon:generational concurrent
parallel:parallel


如果-Xmx小于128M,缺省使用gencopy,否则使用gencon
-Xgcpause打印由垃圾回收器造成的停顿时间
-Xgcreport打印垃圾回收报表
-Xjvmpi是否允许JVMPI事件,这些事件有:

entryexit(缺省ON)
allocs(缺省ON)
monitors(缺省ON)
arenasdelete(缺省OFF)


-Xmanagement激活JVM中的管理服务器,在JVM的管理控制台能连接到它之前,必须先激活。
-Xms设置初始堆大小,单位有K、M、G
-Xmx设置最大堆大小,单位有K、M、G
-Xnativethreads使用本地线程系统,这是缺省选项
-Xnoclassgc禁止对类作垃圾回收
-Xnohup告诉JRockit,忽略CTRL_LOGOFF_EVENT和SIGHUP事件
-Xns设置nursery尺寸,单位有K、M、G
-Xss设置线程栈尺寸,单位有K、M、G
-Xthinthreads使用JRockit的高性能线程系统,在IA64上不可用。
-Xverbose让JRockit打印更多的信息,可选的参数有:

codegen、cpuinfo、gc、load、memory、Opt


-Xverify作完整的bytecode一级的校验
四.用JRockit8.1中的Method Profiler调优WebLogic
1.关于Method Profiler工具

BEA WebLogic JRockit 8.1提供了一个Profiling工具:Method Profiler来调优WebLogic应用。

2.利用Method Profiler调优WebLogic应用

JRockit 8.1所带的Method Profiler工具能够将所有在JRockit Java虚拟机上执行的成员方法的调用次数、执行的总时间和每次调用的执行时间都统计出来,如图1所示。这样的功能一来可以让我们对跑在WebLogic 上的应用进行tuning(代码级的),二来也大大方便了我们确定系统瓶颈在何处。这也可以说是JRockit JVM相对于其他JVM在功能上的一大优势。

北京联动北方科技有限公司

在一次对WebLogic Server 8.1的压力测试中,对一组包含了CMP特性的样本进行压力测试时,就利用JRockit的Method Profiler诊断出了系统的瓶颈所在,现
介绍
如下。CMP这组样本中原先对CMP Entity Bean的操作除了用ejbCreate插入一条记录之外,紧跟着用setName方法设置其name属性,即UPDATE其对应
数据
库记录中name域的值,代码如下:

public void ejbCreate() //Stateful4CMPBean中的方法
throws CreateException
{
      try
      {
            Context ctx = new InitialContext();
            SheepHome home = (SheepHome)ctx.lookup("Sheep");
            Sheep sheep = null;
            int x = getNextId(); // getNextId()也包含对数据库的操作
            sheep = home.create(x);
            if(sheep != null)
            {
                  sheep.setName("sheep1".concat(String.valueOf(String.valueOf(x))));
                  m_strMsg = "create sheep".concat(String.valueOf(String.valueOf(x)));
            } else
            {
                  m_strMsg = "The sheep name is not created.";
            }
      }
      catch(Exception e)
      {
            m_strMsg =
            "*** some exception occured! (CMP) ".concat(String.valueOf(String.valueOf(e.getMessage())));
      }
}


此时测出来的数据,TPS平均值非常低,且测试时Response Time总是随着时间的增长几乎呈线性攀升。于是用Method Profiler进行诊断:

(1) 在JRockit的启动参数中加入-Xmanagement,以便启动JRockit的时候同时启动其Management Server。

(2) 启动JRockit Management Console,并且将其连接到启动了的Management Server上。(在做压力测试时用JRockit Management Console进行观察对性能的损耗可以忽略不计)

(3) 在JRockit Management Console中,将ToolsàPreferences菜单中的Mode of operation属性设为developer。

(4) 在Method Profiler属性页中添加你所需要观察的类的成员方法。

(5) 按Start按钮让Method Profiler开始进行统计。

Time/Inv(ns)指标的显示结果表明Stateful4CMPBean.ejbCreate()代码所含逻辑成为了系统的瓶颈。结果又显示 getNextId()和home.create()操作消耗的时间只占Stateful4CMPBean.ejbCreate()的一小部分,而 sheep.setName()操作消耗的时间却占了Stateful4CMPBean.ejbCreate()的剩下的(指除去getNextId() 和home.create()操作消耗的时间)绝大部分。

于是又用Method Profiler作了一系列实验,结果如下:用1个用户做压力测试,sheep.setName()操作消耗的时间为X,getNextId()操作消耗 的时间为Y,home.create()操作消耗的时间为Z;用2个用户做压力测试,sheep.setName()操作消耗的时间约为 2X,getNextId()操作消耗的时间约为Y,home.create()操作消耗的时间约为Z;用3个用户做压力测 试,sheep.setName()操作消耗的时间约为3X,getNextId()操作消耗的时间约为Y,home.create()操作消耗的时间约 为Z。可以比较肯定地判断,sheep.setName()执行的是一个串行化的逻辑。检查Oralce中UPDATE的ISOLATION- LEVEL,果然为SERIALIZABLE。

将sheep.setName("sheep1".concat(String.valueOf(String.valueOf(x)))); 这句代码删掉。

重新测试,TPS平均值有很大幅度的提高,Response Time在压力测试开始一段时间后也趋于平稳,几乎呈水平线走势




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论