G1垃圾回收器

kimmking大约 7 分钟

我是 javapub，一名 Markdown 程序员从👨‍💻，八股文种子选手。

： G1垃圾收集器?听说很牛逼的样子!

是的,G1是JDK9默认的垃圾收集器,代替了CMS收集器。它的目标是达到更高的吞吐量和更短的GC停顿时间。

：听你一说,我就不高兴了!G1到底好在哪儿?

G1具有以下优点:

并发和增量式回收:不像CMS要全部STW,G1可以渐进式回收,不停顿太久。

// G1CollectedHeap.java
void collectGarbage(G1ConcurrentMark mark) {
    initial-mark; // STW
    remark();     // Concurrent 
    cleanup();    // STW
    concurrent-cleanup();  // Concurrent
}

分代回收:不需要一次全堆回收,可以分代增量回收,选择性回收新生代和老年代。

void collectGarbage(boolean collectOnlyYongGen) {
    if (collectOnlyYongGen) {
        collectYoungGenGarbage();  // only YongGen
    } else {
        collectGarbage(); // YongGen and Old Gen
    }
}

空间整合:通过Remembered Sets实现空间整合,解决碎片问题。

// G1RemSet.java
void addToRememberedSets(HeapRegion from, HeapRegion to) { 
    from.addRememberedSetEntry(to); 
}

预测分析:通过限定垃圾产生速率,动态调整回收频率与时间,实现高吞吐量。

：垃圾收集里最让我头疼的就是“Remembered Sets”和“卡片表”,解释一下?

Remembered Sets和Card Tables都是G1用来管理堆和处理垃圾回收的重要数据结构。

Remembered Sets:记录不同Region之间的引用关系,用于判定垃圾。由于G1采用分代和分片回收,需要记录新生代和老年代以及各个Region之间的引用链,这就是Remembered Sets要做的工作。
Card Tables:由Remembered Sets维护的引用链过于精细,代价太大。所以,G1引入Card Tables,按照内存块做了分段,如果一个分段里至少有一个对象被老年代引用,则标记整个分段为”脏“。在回收时只处理”脏“的分段,提高效率。
它们的工作可以简述为:Remembered Sets记录精细的引用信息,Card Tables进行概括性标记,在GC时结合使用,达到高精度且高性能的铁子回收效果。
可以看到,Remembered Sets和Card Tables是G1高效率回收的关键,它们让G1不需要像CMS那样全堆回收,可以有选择性地、增量式地进行分代、分片的回收,极大的提高了工作效率。

：原来如此,G1之所以马力十足,关键还是它发明的这套“铁子”数据结构,聪明!

谢谢面试官的赞赏和提议!我会继续努力学习,如果有机会能参与。

：说说G1的垃圾回收过程?

G1的垃圾回收过程可以分为以下几个主要阶段:

初始标记:标记GC Roots能直接关联的对象,需要Stop The World。

private void initialMark() {
    for (Object obj : strongRefs) {
        G1CollectedHeap.mark(obj);
    }
}

并发标记:从GC Roots开始对堆中对象进行并发标记,需要部分STW。
最终标记:修正并发标记期间的错误标记,需要STW。
筛选回收:根据标记和Card Table结果筛选回收区域,回收垃圾,需要STW。

// 筛选待回收区域
void selectGarbageCollectionCandidates() {
    Region[] filtered = filterRegions(); 
    garbageCollect(filtered);
}

并发清理:与用户线程一起工作,对标记和筛选阶段误差产生的垃圾链进行清理。
并发重置:与用户线程一起工作,为下次GC做准备。

这一过程实际上和CMS非常相似,同为“标记-清除”算法。但G1在并发标记的基础上,通过Remembered Sets和Card Tables实现了分代回收和空间整合,这也是它能达到高性能的关键。

：说G1是“标记-清除”,是不是太武断了?它用的不正是你刚才提到的那套铁子数据结构吗?

您说的对,我的表述确实有失妥当。更准确的来说:

G1继承了“标记-清除”算法的思想,但已远非传统意义上的“标记-清除”。
G1引入了Remembered Sets和Card Tables,实现了细致且高效的分代、分片增量回收,这是它的重要创新点。
所以,G1是在“标记-清除”思想上做出重大改进、发展和优化而成的一种高性能垃圾收集器,将它简单归类为“标记-清除”算法已忽略其最关键的优点。
G1与CMS一脉相承,但已大大超越,其性能和效率甚至与“复制”算法接近,堪称一代新高。所以,更准确的说法应是:G1继承了标记-清除模型,但在算法和实现上都已经有了重大创新,超越了传统标记-清除算法,达到一种混合模型与新高度,是一款高性能、高效率的收集器。

：对,你的理解已经趋于准确和清晰。能看出G1的创新之处,并不简单归类,这说明你对收集器的认知已逐步深入。

： G1收集器的设计与实现还有哪些关键点需要关注?

除了我们讨论过的Remembered Sets和Card Tables外,G1的设计与实现还有其他一些关键点:

Region:将整个堆内存分割成多个大小相等的Region,作为回收和管理的基本单元。
Humongous Object:对超大对象特殊处理,让其占用连续的Region。
Remembered Sets:记录不同Region之间的引用关系,但过于精细,通过Card Tables进行优化。
Card Tables:按Region进行内存分块,标记”脏“的Region,在GC时优先处理。
Coloreo Grey Lists:通过颜色标记法管理标记过程,避免重复标记对象。
回收率与吞吐量预测:通过统计与分析,动态预测并调整回收率与吞吐量,实现自动调优。
增量式并发回收:通过分代和分片回收,以及STW与并发相结合,实现渐进式回收与低停顿。
空闲区整理:通过回收产生的空闲区的合并整理,解决空间碎片问题。
Safepoint:在STW阶段,用于保证用户线程的一致性快照。但开销大,所以尽量减少STW次数。

这些都是G1高性能与低停顿的关键 support,对其设计与实现有深入理解,可以更好运用G1收集器。当然,本回答只能简要提及,实际上G1的设计极为复杂精巧,需要深入研读源码和官方文档方能全面理解。

： Wonderful! 你对G1的理解已经相当深入全面,提到的这些关键点imovativ析得很透彻。G1的设计确实非常复杂精巧,能达到如此水平的理解,看来你在这方面下了不少功夫!

非常感谢您的赞赏!我会持之以恒,继续深入学习G1与其他垃圾收集器的设计与实现。事实上,想全面深入理解G1还需要我继续努力,它的设计之巧妙令人颇感佩服与惊叹,这也使得我在研究这个课题上收获颇丰。谢谢您的提问,让我有机会梳理和总结这些关键点,这对我加深理解G1有很大帮助。我亟需在实践中不断磨练这些理论知识,并且对更多案例和细节有所了解,这需要我继续学习和努力。

：开心能听到你如此谦逊好学的态度。

最近我在更新《面试1v1》系列文章，主要以场景化的方式，讲解我们在面试中遇到的问题，致力于让每一位工程师拿到自己心仪的offer，感兴趣可以关注公众号JavaPub追更！

🎁目录合集：

Gitee：https://gitee.com/rodert/JavaPub

GitHub：https://github.com/Rodert/JavaPub

http://javapub.net.cn