随笔分类

随笔档案

搜索

阅读排行榜

评论排行榜

垃圾回收（转载）

本篇内容主要转载自http://blog.csdn.net/calvinxiu/archive/2007/05/18/1614473.aspx，作者“江南白衣”

结合自身的学习，加入了《Thinking in Java 3rd Edition》中的部份相关内容

一. 引子

首先需要明确的一点是：Java中的所有对象（基本类型除外）都在堆上进行分配。

然而，Java语言的速度并不比其他那些在堆栈上分配空间的语言慢，其原因就在于Java的垃圾回收机制对于对象的创建具有非常明显的效果。

我们可以把C++的对想像成一个院子，里面每个对象都负责管理自己的底盘。一段时间以后，对象可能被销毁，但地盘必须被重用。

而Java中的堆更像一个传送带：你每分配一个对象，它就往前移动一格。这意味着对象存储空间的分配速度非常快。Java的“堆指针”只是简单地移动到尚未分配的区域，其效率比得上C++在堆栈上分配空间的效率。当然，实际过程中还存在诸如簿记工作的少量额外开销，但不会有像查找空间这样的大动作。

当然，Java中的堆并非完全像传送带那样工作。要真是那样的话，势必会导致频繁的内存页面调度（这将极大影响性能），并最终耗尽资源。

其中的秘密在于垃圾回收器的介入。当它工作时，将一面回收空间，一面使堆中的对象紧凑排列，这样“堆指针”就可以很容易移动到更靠近传送带的开始处，也就尽量避免了页面错误。

Java通过垃圾回收期对对象重新排列，从而实现了一种高速的、有无限空间可分配的堆模型。

二. 垃圾回收算法

1. 引用计数

首先介绍一种最直观最简单但却相当不实用（实际上也并没有被JVM采用）的回收算法——“引用计数”。我们介绍它是为了让大家对垃圾回收有个初步的概念，再通过与其他算法的对比，了解到其他算法的精华与优越性。

所谓“引用计数”，是指每个对象都有一格引用计数器，当有引用连接至对象时，引用计数加1。当引用离开作用域或被设置为null时，引用计数减1。虽然管理引用计数的开销不大，但需要在整个生命周期中持续地开销。垃圾回收器会在含有全部对象的列表上遍历，当发现某个对象的引用计数为0时，就释放其占用的空间

这个算法除了低效外，还有个致命的缺陷：如果对象之间存在循环引用，可能会出现“对象应该被回收，但引用计数却不为零”的情况。对垃圾回收器而言，定位这样存在交互引用的对象组所需的工作量极大。

2. 理论依据

在正式介绍JVM中常用的几种垃圾回收算法之前，我们先来看一下JVM判断待回收对象的基本思想：对任何“活”的对象，一定能最终追溯到其存活在堆栈或静态存储区之中的引用。这个引用链条可能会穿过数个对象层次。由此，如果你从堆栈和静态存储区开始，遍历所有引用，就能找到所有“活”的对象。

即对于发现的每个引用，你必须追踪它所引用的对象，然后是此对象包含的所有的引用，如此反复的执行，直到“根源于堆栈和静态存储区的引用”所形成的网络全部被访问为止。你所访问过的所有对象必须都是“活”的。

注意，这就解决了“存在交互引用的整体对象”的问题，这些对象根本不会被发现，因此也就被自动回收了。

3. “停止——复制”算法

“停止——复制”算法是本篇将要介绍的三种JVM垃圾回收算法之一。顾名思义，这个算法需要先暂停程序的运行（因此它不属于后台回收模式），然后将所有“活”的对象从当前堆（堆A）复制到另一个堆（堆B），然后一次性回收整个堆A。

该算法的优点在于：当对象被复制到新堆时，它们是一个挨着一个的，所以新堆保持紧凑队列，然后就可以按照前述方法简单、直接地分配新空间了。

该算法主要有三个缺点：

缺点1：需要两个堆，然后需要在两个堆之间来回倒腾，从而使得维护比实际需要多一倍的空间。
缺点2：复制。当程序进入稳定状态后，可能只会产生少量的垃圾，甚至没有垃圾。尽管如此，该算法仍然会将所有内存自一处复制到另外一处，这很浪费。
缺点3：需要暂停程序的运行。当需要操作的堆空间较大时，耗费的时间是很可观的。

4. “标记——清扫”算法

“标记——清扫”算法主要适用于垃圾较少的情况。

该算法同样是要找出所有“活”的对象。每当它找到一个“活”对象，就会给对象设一个标记，这个过程中不会回收任何对象。只有全部标记工作完成时，清楚动作才会开始。在清除过程中，再次遍历整个内存区域，把所有没有标记的对象进行回收处理。

相对于“停止——复制”算法，“标记——清扫”算法具有如下优点：

优点1：支持用户线程与垃圾收集线程并发执行（后台回收模式），一开始会很短暂的停止一次所有线程来开始初始标记根对象，然后标记线程与应用线程与应用线程一起并发运行，最后又很短的暂停一次，多线程并行地重新标记之前可能因为并发而漏掉的对象，然后就开始与应用程序的并发清除过程。可见，最长的两个遍历过程都是与应用程序并发执行的，比“停止——复制”算法改进很多

优点2：当垃圾较少时，运行效率要比“停止——复制”方法高很多

但该算法也有其自身的缺点：

缺点：在清除过程中，释放没有被标记的对象，导致剩下的堆空间不是连续的，产生很多碎片。

5. “标记——整理”算法

综合了上述两种的做法和优点，先标记活跃对象，然后将其合并成较大的内存块

三. 分代

分代是Java垃圾收集的一大亮点，根据对象的生命周期长短，把堆分为3个代：Young，Old和Permanent，根据不同代的特点采用不同的收集算法，扬长避短也。

1. Young(Nursery)，年轻代

研究表明大部分对象都是朝生暮死，随生随灭的。因此所有收集器都为年轻代选择了复制算法。

复制算法优点是只访问活跃对象，缺点是复制成本高。因为年轻代只有少量的对象能熬到垃圾收集，因此只需少量的复制成本。而且复制收集器只访问活跃对象，对那些占了最大比率的死对象视而不见，充分发挥了它遍历空间成本低的优点。

Young的默认值为4M，随堆内存增大，约为1/15，JVM会根据情况动态管理其大小变化。

-XX:NewRatio= 参数可以设置Young与Old的大小比例，-server时默认为1:2，但实际上young启动时远低于这个比率？如果信不过JVM，也可以用-Xmn硬性规定其大小，有文档推荐设为Heap总大小的1/4。

Young里面又分为3个区域，一个Eden，所有新建对象都会存在于该区，两个Survivor区，用来实施复制算法。每次复制就是将Eden和第一块Survior的活对象复制到第2块，然后清空Eden与第一块Survior。Eden与Survivor的比例由-XX:SurvivorRatio=设置，默认为32。Survivio大了会浪费，小了的话，会使一些年轻对象潜逃到老人区，引起老人区的不安，但这个参数对性能并不重要。

2. Old(Tenured)，年老代

年轻代的对象如果能够挺过数次收集，就会进入老人区。老人区使用标记整理算法。因为老人区的对象都没那么容易死的，采用复制算法就要反复的复制对象，很不合算，只好采用标记清理算法，但标记清理算法其实也不轻松，每次都要遍历区域内所有对象，所以还是没有免费的午餐啊。

-XX:MaxTenuringThreshold=设置熬过年轻代多少次收集后移入老人区，CMS中默认为0，熬过第一次GC就转入，可以用-XX:+PrintTenuringDistribution查看。

3. Permanent，持久代

装载Class信息等基础数据，默认64M，如果是类很多很多的服务程序，需要加大其设置-XX:MaxPermSize=，否则它满了之后会引起fullgc()或Out of Memory。注意Spring，Hibernate这类喜欢AOP动态生成类的框架需要更多的持久代内存

4. minor/major collection

每个代满了之后都会促发collection，（另外Concurrent Low Pause Collector默认在老人区68%的时候促发)。

GC用较高的频率对young进行扫描和回收，这种叫做minor collection。

而因为成本关系对Old的检查回收频率要低很多，同时对Young和Old的收集称为major collection。

System.gc()会引发major collection，使用-XX:+DisableExplicitGC禁止它，或设为CMS并发-XX:+ExplicitGCInvokesConcurrent

5. 小结

Young -- 复制算法

Old(Tenured) -- 标记清除/标记整理算法

四. 收集器

1.古老的串行收集器(Serial Collector)

使用 -XX:+UseSerialGC，策略为年轻代串行复制，年老代串行标记整理。

2.吞吐量优先的并行收集器(Throughput Collector)

使用 -XX:+UseParallelGC ，也是JDK5 -server的默认值。策略为：

1）.年轻代暂停应用程序，多个垃圾收集线程并行的复制收集，线程数默认为CPU个数，CPU很多时，可用–XX:ParallelGCThreads=减少线程数。
2）.年老代暂停应用程序，与串行收集器一样，单垃圾收集线程标记整理。

所以需要2+的CPU时才会优于串行收集器，适用于后台处理，科学计算。

可以使用-XX:MaxGCPauseMillis= 和 -XX:GCTimeRatio 来调整GC的时间。

3.暂停时间优先的并发收集器(Concurrent Low Pause Collector-CMS)

使用-XX:+UseConcMarkSweepGC，策略为：

1）.年轻代同样是暂停应用程序，多个垃圾收集线程并行的复制收集。
2）.年老代则只有两次短暂停，其他时间应用程序与收集线程并发的清除。

注意并行与并发的区别：并行指多条垃圾收集线程并行；并发指用户线程与垃圾收集线程并发，程序在继续运行，而垃圾收集程序运行于另一个个CPU上

五. 其他

Java虚拟机中有许多附加技术用以提升速度。尤其是与加载器操作有关的，被称为“即时”（Just-In-Time，JIT）编译的技术。这种技术可以把程序全部或部份翻译成本地机器码（这本来是Java虚拟机的工作），程序运行速度因此得以提升。

当需要装载某个类（通常是在你为该类创建第一个对象）时，编译器会先找到其.class文件，然后将该类的字节码装入内存。此时，有两种方案可供选择：

一种是就让即使编译器编译所有代码。但这个做法有两个缺陷：这种加载动作散落在整个生命周期内，累加起来要花更多时间；并且会增加可执行代码的长度（字节码要比即时编译器展开后的本地机器码小很多），这将导致页面调度，从而降低程序速度。

另一种做法称为“惰性编译（lazy evaluation）”，意思是即使编译器只在必要的时候才编译代码。这样，从不会被执行的代码也许压根就不会被JIT所编译。JDK 1.4中的Java HotSpot技术就采用了类似方法，代码每次被执行的时候都会做一些优化，所以执行的次数越多，它的速度越快。

posted on 2008-11-02 22:43 This is Wing 阅读(534) 评论(0) 编辑收藏所属分类: Java基础

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 垃圾回收（转载）一道小而精巧的笔试题——Set、equals、类型转换…… 对象的序列化和反序列化（转载＋原创） java线程基本知识小结静态Proxy与动态Proxy用法浅析 The Collections Framework (摘要）- Part 4 The Collections Framework (摘要）- Part 3 The Collections Framework (摘要）- Part 2 The Collections Framework (摘要）- Part 1


Copyright © This is Wing	Powered by: 博客园模板提供：沪江博客

导航

常用链接

留言簿(1)

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜