[转帖]WebLogic管理精华—— 三.监控调优_Tomcat, WebLogic及J2EE讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3539 | 回复: 0

主题： [转帖]WebLogic管理精华—— 三.监控调优

eink

注册用户

等级：上尉
经验：764
发帖：54
精华：0
注册：2012-11-13
状态：离线
发送短消息息给eink

加好友发送短消息息给eink

发消息

发表于：

2012-11-15 17:03:34 | [全部帖] [楼主帖]

楼主

1 理解JVM的垃圾收集机制

1.1 简述 GC即垃圾收集机制是指JVM用于释放那些不再使用的对象所占用的内存。java语言并不要求JVM有GC，也没有规定GC如何工作。不过常用的JVM都有GC，而且大多数GC都使用类似的算法管理内存和执行收集操作。在充分理解了垃圾收集算法和执行过程后，才能有效的优化它的性能。有些垃圾收集专用于特殊的应用程序。比如，实时应用程序主要是为了避免垃圾收集中断，而大多数OLTP应用程序则注重整体效率。理解了应用程序的工作负荷和JVM支持的垃圾收集算法，便可以进行优化配置垃圾收集器。垃圾收集的目的在于清除不再使用的对象。GC通过确定对象是否被活动对象引用来确定是否收集该对象。GC首先要判断该对象时候可以收集。两种常用的方法是引用计数和对象引用遍历。引用计数存储对特定对象的所有引用数，也就是说，当应用程序创建引用以及引用超出范围时，JVM必须适当增减引用数。当某对象的引用数为0时，便可以进行垃圾收集。早期的JVM使用引用计数，现在大多数JVM采用对象引用遍历。对象引用遍历从一组对象开始，沿着整个对象图上的每条链接，递归确定可到达（reachable）的对象。如果某对象不能从这些根对象的一个（至少一个）到达，则将它作为垃圾收集。在对象遍历阶段，GC必须记住哪些对象可以到达，以便删除不可到达的对象，这称为标记（marking）对象。下一步，GC要删除不可到达的对象。删除时，有些GC只是简单的扫描堆栈，删除未标记的对象，并释放它们的内存以生成新的对象，这叫做清除（sweeping）。这种方法的问题在于内存会分成好多小段，而它们不足以用于新的对象，但是组合起来却很大。因此，许多GC可以重新组织内存中的对象，并进行压缩（compact），形成可利用的空间。为此，GC需要停止其他的活动活动。这种方法意味着所有与应用��序相关的工作停止，只有GC运行。结果，在响应期间增减了许多混杂请求。另外，更复杂的 GC不断增加或同时运行以减少或者清除应用程序的中断。有的GC使用单线程完成这项工作，有的则采用多线程以增加效率。

1.2 下面列举一些JVM使用的GC 标记－清除收集器：这种收集器首先遍历对象图并标记可到达的对象，然后扫描堆栈以寻找未标记对象并释放它们的内存。这种收集器一般使用单线程工作并停止其他操作。标记－压缩收集器：有时也叫标记－清除－压缩收集器，与标记－清除收集器有相同的标记阶段。在第二阶段，则把标记对象复制到堆栈的新域中以便压缩堆栈。这种收集器也停止其他操作。复制收集器这种收集器将堆栈分为两个域，常称为半空间。每次仅使用一半的空间，JVM生成的新对象则放在另一半空间中。GC运行时，它把可到达对象复制到另一半空间，从而压缩了堆栈。这种方法适用于短生存期的对象，持续复制长生存期的对象则导致效率降低。增量收集器增量收集器把堆栈分为多个域，每次仅从一个域收集垃圾。这会造成较小的应用程序中断。有多种方法可以定义实际的GC。分代收��器这种收集器把堆栈分为两个或多个域，用以存放不同寿命的对象。JVM生成的新对象一般放在其中的某个域中。过一段时间，继续存在的对象将获得使用期并转入更长寿命的域中。分代收集器对不同的域使用不同的算法以优化性能。并发收集器并发收集器与应用程序同时运行。这些收集器在某点上一般都不得不停止其他操作以完成特定的任务，但是因为其他应用程序可进行其他的后台操作，所以中断其他处理的实际时间大大降低。并行收集器并行收集器使用某种传统的算法并使用多线程并行的执行它们的工作。在多cpu机器上使用多线程技术可以显著的提高java应用程序的可扩展性。

1.3 Sun Hotspot 1.4.1 JVM堆大小的调整

Sun Hotspot 1.4.1使用分代收集器，它把堆分为三个主要的域：新域、旧域以及永久域。JVM生成的所有新对象放在新域中。一旦对象经历了一定数量的垃圾收集循环后，便获得使用期并进入旧域。在永久域中JVM则存储class和method对象。就配置而言，永久域是一个独立域并且不认为是堆的一部分。

下面介绍如何控制这些域的大小。

可使用-Xms和-Xmx控制整个堆的原始大小或最大值。比如，下面的命令是把初始大小设置为128M： java –Xms128m –Xmx256m 为控制新域的大小，

可使用-XX:NewRatio设置新域在堆中所占的比例。比如下面的命令把整个堆设置成128m，新域比率设置成3，即新域与旧域比例为1：3，新域为堆的1/4或32M： java –Xms128m –Xmx128m –XX:NewRatio =3

可使用-XX:NewSize和-XX:MaxNewsize设置新域的初始值和最大值。比如，下面的命令把新域的初始值和最大值设置成64m: java –Xms256m –Xmx256m –Xmn64m

一般不把永久域当作堆的一部分。运行程序时，JVM会调整永久域的大小以满足需要。每次调整时，JVM会对堆进行一次完全的垃圾收集。

使用-XX:MaxPerSize标志来增加永久域的大小。在WebLogic Server应用程序加载较多类时，经常需要增加永久域的最大值。当JVM加载类时，永久域中的对象急剧增加，从而使JVM不断调整永久域大小。

为了避免调整，可使用-XX:PerSize标志设置初始值。比如，下面把永久域初始值设置成32m，最大值设置成64m。 java –Xms512m –Xmx512m –Xmn128m –XX:PermSize=32m –XX:MaxPermSize=64m

默认状态下，HotSpot在新域中使用复制收集器。该域一般分为三个部分。第一部分为Eden，用于生成新的对象。另两部分称为救助空间，当Eden充满时，收集器停止应用程序，把所有可到达对象复制到当前的from救助空间，一旦当前的from救助空间充满，收集器则把可到达对象复制到当前的to救助空间。From和to救助空间互换角色。维持活动的对象将在救助空间不断复制，直到它们获得使用期并转入旧域。

使用-XX:SurvivorRatio可控制新域子空间的大小。同NewRation一样，SurvivorRation规定某救助域与Eden空间的比值。比如，以下命令把新域设置成64m，Eden占32m，每个救助域各占16m： java –Xms256m –Xmx256m –Xmn64m –XX:SurvivorRation=2

如前所述，默认状态下HotSpot对新域使用复制收集器，对旧域使用标记－清除－压缩收集器。在新域中使用复制收集器有很多意义，因为应用程序生成的大部分对象是短寿命的。理想状态下，所有过渡对象在移出Eden空间时将被收集。如果能够这样的话，并且移出Eden空间的对象是长寿命的，那么理论上可以立即把它们移进旧域，避免在救助空间反复复制。但是，应用程序不能适合这种理想状态，因为它们有一小部分中长寿命的对象。最好是保持这些中长寿命的对象并放在新域中，因为复制小部分的对象总比压缩旧域廉价。为控制新域中对象的复制，可用-XX:TargetSurvivorRatio控制救助空间的比例。该值是一个百分比，默认值是50。当较大的堆栈使用较低的sruvivorratio时，应增加该值到80至90，以更好利用救助空间。用-XX:maxtenuring threshold可控制上限。为放置所有的复制全部发生以及希望对象从eden扩展到旧域，可以把MaxTenuring Threshold设置成0。设置完成后，实际上就不再使用救助空间了，因此应把SurvivorRatio设成最大值以最大化Eden空间，设置如下： java … -XX:MaxTenuringThreshold=0 –XX:SurvivorRatio＝5000

1.4 从JVM中获取信息以助于调整方案 -verbose.gc开关可显示GC的操作内容。打开它，可以显示最忙和最空闲收集行为发生的时间、收集前后的内存大小、收集需要的时间等。打开-xx:+ printgcdetails开关，可以详细了解GC中的变化。打开-XX: + PrintGCTimeStamps开关，可以了解这些垃圾收集发生的时间，自JVM启动以后以秒计量。最后，通过-xx: + PrintHeapAtGC开关了解堆的更详细的信息。为了了解新域的情况，可以通过-XX:=PrintTenuringDistribution开关了解获得使用期的对象权。

3.1.5 BEA JRockit JVM的使用 Bea WebLogic 8.1使用的新的JVM用于Intel平台。在Bea安装完毕的目录下可以看到有一隼嗨朴趈rockit81sp1_141_03的文件夹。这就是Bea新JVM所在目录。不同于HotSpot把Java字节码编译成本地码，它预先编译成类。JRockit还提供了更细致的功能用以观察JVM的运行状态，主要是独立的GUI控制台或者WebLogic Server控制台。

Bea JRockit JVM支持4种垃圾收集器：

分代复制收集器：它与默认的分代收集器工作策略类似。对象在新域中分配，即JRockit文档中的nursery。这种收集器最适合单CPU机上小型堆操作。

单空间并发收集器：该收集器使用完整堆，并与背景线程共同工作。尽管这种收集器可以消除中断，但是收集器需花费较长的时间寻找死对象，而且处理应用程序时收集器经常运行。如果处理器不能应付应用程序产生的垃圾，它会中断应用程序并关闭收集。

分代并发收集器：这种收集器在护理域使用排它复制收集器，在旧域中则使用并发收集器。由于它比单空间共同发生收集器中断��繁，因此它需要较少的内存，应用程序的运行效率也较高，注意，过小的护理域可以导致大量的临时对象被扩展到旧域中。这会造成收集器超负荷运作，甚至采用排它性工作方式完成收集。

并行收集器：该收集器也停止其他进程的工作，但使用多线程以加速收集进程。尽管它比其他的收集器易于引起长时间的中断，但一般能更好的利用内存，程序效率也较高。

默认状态下，JRockit使用分代并发收集器。要改变收集器，可使用-Xgc:，对应四个收集器分别为gencopy， singlecon，gencon以及parallel。

可使用-Xms和-Xmx设置堆的初始大小和最大值。要设置护理域，则使用-Xns: java –jrockit –Xms512m –Xmx512m –Xgc:gencon –Xns128m… 尽管JRockit支持-verbose:gc开关，但它输出的信息会因收集器的不同而异。JRockit还支持memory、load和codegen的输出。

原文地址：http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=124&threadID=19031&tstart=0

2 WebLogic Server Hang产生的一般原因

2.1 系统内存不足系统CPU忙，系统文件描述符数目不足，线程死锁，JVM有GC方面的bug，对于一些特定的情况可以使用truss命令跟踪系统调用来进行分析。可以打开JVM的gc log,在java命令行上加上-verbose:gc,GC的log输出在java进程的标准输出里,在hp的JVM上，可以通过在java命令行上加-Xverbosegc:file=gcfilename来将gc log写到指定的文件其输出类似：[GC 15639K->13700K(65280K), 0.0068439 lsecs]。

解决办法是调整JVM的内存设置和gc算法,升级jvm或是os patch。出现OutOfMemoryError或是观察到内存吃紧，操作系统本身的剩余内存，通过top或是vmstat观察，操作系统的swap区，Swap区太小可能导致编译jsp时报“Not enough space”的错，操作系统kernel参数中maxsize的大小，如果观测到数据库连接池里的连接泄漏，极可能是内存泄漏的先兆

JVM的heap区大小，通过java命令行��的-Xms,-Xmx指定，建议最小值和最大值设成一样，可以通过WebLogic console上server/monitor/performance来观察其使用情况，建议生产系统最256M，一般情况下可以设置为系统剩余物理内存的80％，Heap size太大在一些JVM上会有问题，对于sun和hp的JVM，permanent size太小也会出OutOfMemoryError，在java命令行上加-XX:MaxPermSize=128m 尽量减少内存消耗，Session中不要放大的数据，并尽量在不再需要的时候remove掉，如果可以调整session timeout到较小的值，避免在J2EE 内存泄漏，可以通过WebLogic server端应用里边调用AWT/swing作图，调整ejb的cache/pool设置 console来观察JVM的heap memory使用情况来获知是否有内存泄漏情况，采用第三方辅助工具来获取更详细信息，如Jprobe/OptimizeIt；有可能是weblogic的bug，但绝大部分情况是由用户的应用引起的，最常见的代码问题是数据库连接没正常关闭。

2.2 系统CPU忙，如果用户访问量很大，CPU占用很高（user态）并不是异常，如果是kernel态很多，需要OS厂商调整操作系统。采用top找到占用CPU很多的进程，如果是非weblogic进程，应该考虑将其移到另外的server上运行，如果是运行weblogic的java进程，通过做thread dump（详细信息后边会介绍到）来确认是那段代码导致了这么高的CPU使用（也有可能是os/jvm本身不正常）

2.3 系统文件描述符数目不足 ulimit –a –H 可以查看当前限制lLog中有“too many open files”的错误，表示达到了系统对一个进程能同时打开的文件数的限制： Solaris上可以通过/usr/proc/bin/pfileslulimit –n number可以来更改当前环境的设置，建议至少��到4096 Solaris上root用户可以通过/usr/proc/bin/plimit -nlpid来查看指定进程的限制和当前使用的file descriptor数目 soft,hard pid来动态更改进程的文件描述符的限制

2.4 线程死锁对于原因不明的hang或是响应慢，最根本的方法就是获取thread dump信息，对于windows系统，在运行java的窗口按Ctrl＋Break，对于UNIX系统，首先用ps找到运行weblogic的java进程的pid，然后执行kill –3 pid，JVM将负责将所有java进程的状态、执行堆栈dump到其标准输出，为了方便获取thread dump信息，在weblogic启动的时候，最好将其标准输出重定向到一个文件，为了反映线程状态的动态变化，需要接连多次做thread ldump，每次间隔10-20s。对于thread dump信息，主要关注的是线程的状态和其执行堆栈，线程的状态一般为三类 Waiting for monitorl Waiting on monitor（CW）：线程主动wait lRunnable（R）：当前可以运行的线程entry（MW）：线程等锁一般关注的都是第一和第三种状态的线程 CPU很忙则关注runnable的线程CPU闲则关注waiting for monitor entry的线程一种典型的死锁是由于在server端应用（比如servlet）中请求由同一weblogic实例serve的资源，解决办法就是将该servlet放到另外的执行队列里去执行。

原文地址：http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=81&threadID=4525&tstart=0&quint=true

3 "指定的网络名不再可用"错误

wl6.1和wl7.0部署应用后都在后台抛出“java.net.SocketException: ReadFile lfailed: 指定的网络名不再可用”,这不是一个致命的错误，只会在中文Window上。如Hilaser和linstone提出了办法：

用wls6.1 sp4，到如下位置下载，如果你是自己随便玩玩，将你的JDK升级到jdk1.3.1_06 http://commerce.bea.com/SoftwareProductDetailWLS?SWName=WebLogic+Server+Evaluation+Software&SWVersion=Version+6.1+SP4&SWPlatform=Microsoft+Windows+NT%2F2000 运行cmd，打开窗口菜单（点击左上角窗口图标），选择默认值，将默认代码页改为437。原文地址：

http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=81&threadID=9393&tstart=0 4

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图