Java垃圾回收机制

详细阐述Java垃圾回收机制

开投注:JAVA的GC主要区域是堆区。JVM有堆、栈、方法区,详情参考基础另一篇文章

##垃圾回收的意义

垃圾回收可以有效的防止内存泄露,有效的使用空闲的内存。
内存泄露:内存使用完后没有进行回收,Java的内存泄漏表现为一个内存对象的生命周期超出了程序需要他的时间长度,也叫“对象游离”。

PS: 关于Android常见的内存泄漏


垃圾回收机制的算法

1.引用计数器

1.1算法分析
垃圾收集器早起的策略,堆中每个对象实例都有一个引用计数,当一个对象被创建时,并且该对象实例被赋值给另一个变量,该变量计数设置为1, 当任何其他变量被赋值为这个对象的引用时,计数加1,例如(a = b; //b的引用计数+1);但是当一个对象的某个引用超过了生命周期或者被设置为一个新值时,对象实例的引用计数器-1。任何引用计数器为0的对象实例可以被当做垃圾收集,例如(a引用b,a=c,b的引用计数器-1);当一个对象实例被垃圾收集时,他引用的任何对象实例的引用计数器-1,例如(a引用b,a被回收,b的计数器-1)。
1.2优缺点
优点:

  • 引用计数收集器可以很快执行,交织在程序运行中,对程序不需要长时间被打断的实现环境比较有利。

缺点:

  • 无法检测出循环引用。 如父对象有一个子对象的引用,子对象反过来引用父对象。这样,他们的引用计数永远不肯能为0。

例如:

1
2
3
4
5
6
7
public void buidDog()
{
Dog newDog = new Dog();
Tail newTail = new Tail();
newDog.tail = newTail;
newTail.dog = newDog;
}

在上面,newTail中拿着对newDog的引用,newDog反过来拿着newTail的引用,如果newDog要被回收,前提是newTail要先被回收,这样才能释放newDog对象。反过来,newTail要被回收前提是释放newDog对象。当bulidDog()方法执行完后,引用计数器无法回收这两个对象。


2.标记-清除算法

2.1 根搜索算法
根搜索算法
根搜索算法是从离散数学中的图论引入的, 程序把所有的引用看做一张图, 从一个节点GC ROOT开始,寻找对应的引用节点,找到这个节点后,继续寻找这个节点的引用节点,当所有的引用节点寻找完毕后,剩余的节点则被认为是没有被引用到的节点,即无用的节点。

Java中可被作为GC ROOT的对象有:

  • 虚拟机栈中引用的对象(本地变量表)
  • 方法区中静态属性引用的对象
  • 方法区中常量的引用对象
  • 本地方法栈中引用的对象(Naive对象)

2.2 标记-清除算法的示意图
标记清除算法

2.3 标记清除算法分析

标记-清除算法采用从根集合进行扫描,对存活的对象进行标记,标记完毕后再扫描整个空间中未被标记的对象,进行回收, 如上图所示, 标记清除算法不需要进行对象的移动,并且仅对不存活的对象进行处理, 在存活对象比较多的情况下极为高效,但由于标记清除算法直接回收不存活的对象,会造成内存碎片。

3.标记-整理算法

3.1 标记整理算法示意图
标记整理算法

3.2 标记整理算法分析

标记整理算法采用标记清除算法的方式进行对象的标记,但在清除时不同,再回收不存活的对象占用的空间后,会将所有的存活对象往左端空间移动, 并更新对应的指针。标记整理算法是在标记清除的基础上,又进行了对象的移动,因此成本更高,但是解决了内存碎片的问题。在实现上,一般增加句柄和句柄表。

4.Copying算法

4.1 Copying算法示意图
Copying算法

4.2 Copying算法分析

Copying算法是为了克服句柄的开销和解决堆碎片的垃圾回收。它开始时把堆分为一个对象面和多个空闲面,程序从对象面为对象分配空间,当对象面满了,基于copying算法的垃圾收集就从根集扫描活动对象,并将每个活动对象复制到空闲面,这样空闲变成了对象面,原来的对象面变成了空闲面,程序会在新的对象面中分配内存。一种典型的基于copying算法的垃圾回收是stop-and-copy算法,他将堆分成对象面和空闲区域面,在对象面与空闲区域面的切换过程中,程序暂停执行。

5.分代收集器

5.1 分代收集器示意图
分代收集器

5.2 分代收集器分析
分代的垃圾回收策略,是基于这样一个事实:不同的对象的生命周期是不一样的。因此,不同生命周期的对象可以采取不同的回收算法,以便提高回收效率。

5.2.1 年轻代(Young Generation)
1.所有的新生成的对象首先都是放在新生代。年轻代的目标就是尽可能快速的收集掉那些生命周期短的对象。
2.新生代的内存按照8:1:1的比例分为一个Eden区和两个Survivor(survivor0,survivor1)区。大部分对象在Eden区生成。回收时先将Eden区存活的对象复制到一个survivor0区,然后清空eden,当这个survivor0区也存满了,则将eden与survivor0存活的对象复制到另一个survivor1,然后清空eden与survivor0,此时survivor0是空的,然后将survivor0与survivor1交换,即保持survivor1为空,如此往复。
3.当survivor1区域不足以存放eden和survivor0的存活对象时,就将存活的对象放到老年代。若是老年代也满了就会触发一次Full GC, 也就是新生代,旧生代都进行回收。
4.新生代的GC也叫作Minor GC,Minor GC发生的频率比较高(不一定等Eden满了才触发)。

5.2.2 老年代(Old Generation)
1.在年轻代经历了N次回收还存活的对象会被放到老年代。因此,可以认为老年代中存放的都是一些生命周期较长的对象。
2.内存也比新生代大很多(大概是1:2),当老年代内存满了会触发Full GC, Full Gc发生频率比较低,老年代存活时间比较长,存活率标记高。

5.2.3 持久代(Permanent Generation)
用于存放静态文件,如Java类、方法等。


GC(垃圾收集器)

新生代收集器:

Serial收集器(复制算法):单线程收集器,标记和清理都是单线程,优点是简单高效。 ParNew收集器(停止-复制算法):Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现。
*Parallel Scavenge收集器(停止-复制算法):并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般为99%, 吞吐量= 用户线程时间/(用户线程时间+GC线程时间)。适合后台应用等对交互相应要求不高的场景。

老年代收集器:

Serial Old收集器(标记-整理算法):老年代单线程收集器,Serial收集器的老年代版本。 Parallel Old收集器(停止-复制算法):Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量优先
*CMS(Concurrent Mark Sweep)收集器(标记-清理算法):高并发、低停顿,追求最短GC回收停顿时间,cpu占用比较高,响应时间快,停顿时间短,多核cpu 追求高响应时间的选择


GC的执行

系统空闲的时候会进行GC
由于对象进行了分代处理,因此垃圾回收区域、时间也不一样。GC有两种类型:Scavenge GC和Full GC。

Scavenge GC

一般情况下,当新对象生成,并且在Eden区申请空间失败时,就会触发Scavenge Gc,对Eden区进行GC,然后整理Survivor区。因为Eden区不会分配很大,所以Eden的GC会频繁进行。因而,一般在这里需要使用速度快,效率高的算法,使Eden尽快空闲。

Full GC

对整个堆进行整理,包括Young,Old,Perm。因为工作量大,所以更加耗时,要尽可能减少FUll Gc次数。触发Full GC的有下面的原因:
1.老年代被写满
2.持久代被写满
3.System.gc()被显示调用
4.上一次GC后Heap的各域分配策略动态变化