ART运行时垃圾收集(GC)过程分析.docx

资源描述

《ART运行时垃圾收集(GC)过程分析.docx》由会员分享，可在线阅读，更多相关《ART运行时垃圾收集(GC)过程分析.docx（74页珍藏版）》请在三一办公上搜索。

1、ART运行时垃圾收集（GC）过程分析ART运行时与Dalvik虚拟机一样，都使用了Mark-Sweep算法进行垃圾回收，因此它们的垃圾回收流程在总体上是一致的。但是ART运行时对堆的划分更加细致，因而在此基础上实现了更多样的回收策略。不同的策略有不同的回收力度，力度越大的回收策略，每次回收的内存就越多，并且它们都有各自的使用情景。这样就可以使得每次执行GC时，可以最大限度地减少应用程序停顿。本文就详细分析ART运行时的垃圾收集过程。ART运行时的垃圾收集收集过程如图1所示：图1的最上面三个箭头描述触发GC的三种情况，左边的流程图描述非并行GC的执行过程，右边的流程图描述并行GC的执行流程，接下

2、来我们就详细图中涉及到的所有细节。在前面一文中，我们提到了两种可能会触发GC的情况。第一种情况是没有足够内存分配请求的分存时，会调用Heap类的成员函数CollectGarbageInternal触发一个原因为kGcCauseForAlloc的GC。第二种情况下分配出请求的内存之后，堆剩下的内存超过一定的阀值，就会调用Heap类的成员函数RequestConcurrentGC请求执行一个并行GC。 Heap类的成员函数RequestConcurrentGC的实现如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片void Heap:RequestConcu

3、rrentGC(Thread* self) / Make sure that we can do a concurrent GC. Runtime* runtime = Runtime:Current(); DCHECK(concurrent_gc_); if (runtime = NULL | !runtime-IsFinishedStarting() | !runtime-IsConcurrentGcEnabled() return; MutexLock mu(self, *Locks:runtime_shutdown_lock_); if (runtime-IsShuttingDown(

4、) return; if (self-IsHandlingStackOverflow() return; / We already have a request pending, no reason to start more until we update / concurrent_start_bytes_. concurrent_start_bytes_ = std:numeric_limits:max(); JNIEnv* env = self-GetJniEnv(); DCHECK(WellKnownClasses:java_lang_Daemons != NULL); DCHECK(

5、WellKnownClasses:java_lang_Daemons_requestGC != NULL); env-CallStaticVoidMethod(WellKnownClasses:java_lang_Daemons, WellKnownClasses:java_lang_Daemons_requestGC); CHECK(!env-ExceptionCheck(); 这个函数定义在文件art/runtime/gc/heap.cc。只有满足以下四个条件，Heap类的成员函数RequestConcurrentGC才会触发一个并行GC： 1. ART运行时已经启动完毕。 2. ART

6、运行时支持并行GC。ART运行时默认是支持并行GC的，但是可以通过启动选项-Xgc来关闭。 3. ART运行时不是正在关闭。 4. 当前线程没有发生栈溢出。上述4个条件都满足之后，Heap类的成员函数RequestConcurrentGC就将成员变量concurrent_start_bytes_的值设置为类型size_t的最大值，表示目前正有一个并行GC在等待执行，以阻止触发另外一个并行GC。最后，Heap类的成员函数RequestConcurrentGC调用Java层的java.lang.Daemons类的静态成员函数requestGC请求执行一次并行GC。Java层的java.lang

7、.Daemons类在加载的时候，会启动五个与堆或者GC相关的守护线程，如下所示：java view plain copy 在CODE上查看代码片派生到我的代码片public final class Daemons . public static void start() ReferenceQueueDaemon.INSTANCE.start(); FinalizerDaemon.INSTANCE.start(); FinalizerWatchdogDaemon.INSTANCE.start(); HeapTrimmerDaemon.INSTANCE.start(); GCDaemon.INST

8、ANCE.start(); . 这个类定义在文件libcore/libart/src/main/java/java/lang/Daemons.java中。这五个守护线程分别是： 1. ReferenceQueueDaemon：引用队列守护线程。我们知道，在创建引用对象的时候，可以关联一个队列。当被引用对象引用的对象被GC回收的时候，被引用对象就会被加入到其创建时关联的队列去。这个加入队列的操作就是由ReferenceQueueDaemon守护线程来完成的。这样应用程序就可以知道那些被引用对象引用的对象已经被回收了。 2. FinalizerDaemon：析构守护线程。对于重写了成员函数fin

9、alize的对象，它们被GC决定回收时，并没有马上被回收，而是被放入到一个队列中，等待FinalizerDaemon守护线程去调用它们的成员函数finalize，然后再被回收。 3. FinalizerWatchdogDaemon：析构监护守护线程。用来监控FinalizerDaemon线程的执行。一旦检测那些重定了成员函数finalize的对象在执行成员函数finalize时超出一定的时候，那么就会退出VM。 4. HeapTrimmerDaemon：堆裁剪守护线程。用来执行裁剪堆的操作，也就是用来将那些空闲的堆内存归还给系统。 5. GCDaemon：并行GC线程。用来执行并行GC。 Ja

10、va层的java.lang.Daemons类的静态成员函数requestGC被调用时，就会唤醒上述的并行GC线程，然后这个并行GC线程就会通过JNI调用Heap类的成员函数ConcurrentGC，它的实现如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片void Heap:ConcurrentGC(Thread* self) MutexLock mu(self, *Locks:runtime_shutdown_lock_); if (Runtime:Current()-IsShuttingDown() return; / Wait for any GCs

11、 currently running to finish. if (WaitForConcurrentGcToComplete(self) = collector:kGcTypeNone) CollectGarbageInternal(next_gc_type_, kGcCauseBackground, false); 这个函数定义在文件art/runtime/gc/heap.cc中。只要ART运行时当前不是处于正在关闭的状态，那么Heap类的成员函数ConcurrentGC就会检查当前是否正在执行GC。如果是的话，那么就等待它执行完成，然后再调用Heap类的成员函数CollectGarba

12、geInternal触发一个原因为kGcCauseBackground的GC。否则的话，就直接调用Heap类的成员函数CollectGarbageInternal触发一个原因为kGcCauseBackground的GC。从这里就可以看到，无论是触发GC的原因是kGcCauseForAlloc，还是kGcCauseBackground，最终都是通过调用Heap类的成员函数CollectGarbageInternal来执行GC的。此外，还有第三种情况会触发GC，如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片void Heap:CollectGarbage

13、(bool clear_soft_references) / Even if we waited for a GC we still need to do another GC since weaks allocated during the / last GC will not have necessarily been cleared. Thread* self = Thread:Current(); WaitForConcurrentGcToComplete(self); CollectGarbageInternal(collector:kGcTypeFull, kGcCauseExpl

14、icit, clear_soft_references); 这个函数定义在文件art/runtime/gc/heap.cc。当我们调用Java层的java.lang.System的静态成员函数gc时，如果ART运行时支持显式GC，那么就它就会通过JNI调用Heap类的成员函数CollectGarbageInternal来触发一个原因为kGcCauseExplicit的GC。ART运行时默认是支持显式GC的，但是可以通过启动选项-XX:+DisableExplicitGC来关闭。从上面的分析就可以看出，ART运行时在三种情况下会触发GC，这三种情况通过三个枚举kGcCauseForAlloc

15、、kGcCauseBackground和kGcCauseExplicitk来描述。这三人枚举的定义如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片/ What caused the GC? enum GcCause / GC triggered by a failed allocation. Thread doing allocation is blocked waiting for GC before / retrying allocation. kGcCauseForAlloc, / A background GC trying to ensure

16、there is free memory ahead of allocations. kGcCauseBackground, / An explicit System.gc() call. kGcCauseExplicit, ; 这三个枚举定义在文件art/runtime/gc/heap.h中。从上面的分析还可以看出，ART运行时的所有GC都是以Heap类的成员函数CollectGarbageInternal为入口，它的实现如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片collector:GcType Heap:CollectGarbageInter

17、nal(collector:GcType gc_type, GcCause gc_cause, bool clear_soft_references) Thread* self = Thread:Current(); . / Ensure there is only one GC at a time. bool start_collect = false; while (!start_collect) MutexLock mu(self, *gc_complete_lock_); if (!is_gc_running_) is_gc_running_ = true; start_collect

18、 = true; if (!start_collect) / TODO: timinglog this. WaitForConcurrentGcToComplete(self); . . if (gc_type = collector:kGcTypeSticky & alloc_space_-Size() IsConcurrent() = concurrent_gc_ & cur_collector-GetGcType() = gc_type) collector = cur_collector; break; . collector-clear_soft_references_ = clea

19、r_soft_references; collector-Run(); . MutexLock mu(self, *gc_complete_lock_); is_gc_running_ = false; last_gc_type_ = gc_type; / Wake anyone who may have been waiting for the GC to complete. gc_complete_cond_-Broadcast(self); . return gc_type; 这个函数定义在文件art/runtime/gc/heap.cc。参数gc_type和gc_cause分别用来描

20、述要执行的GC的类型和原因，而参数clear_soft_references用来描述是否要回收被软引用对象引用的对象。 Heap类的成员函数CollectGarbageInternal的执行逻辑如下所示： 1. 通过一个while循环不断地检查Heap类的成员变量is_gc_running_，直到它的值等于false为止，这表示当前没有其它线程正在执行GC。当它的值等于true时，就表示在其它线程正在执行GC，这时候就要调用Heap类的成员函数WaitForConcurrentGcToComplete等待其执行完成。注意，在当前GC执行之前，Heap类的成员变量is_gc_running_会被

21、设置为true。 2. 如果当前请求执行的GC的类型为kGcTypeSticky，但是当前Allocation Space的大小小于Heap类的成员变量min_alloc_space_size_for_sticky_gc_指定的阀值，那么就改为执行类型为kGcTypePartial。关于类型为kGcTypeSticky的GC的执行限制，可以参数前面一文。 3. 从Heap类的成员变量mark_sweep_collectors_指向的一个垃圾收集器列表找到一个合适的垃圾收集器来执行GC。从前面一文可以知道，ART运行时在内部创建了六个垃圾收集器。这六个垃圾收集器分为两组，一组支持并行GC，另一组

22、不支持。每一组都是由三个类型分别为kGcTypeSticky、kGcTypePartial和kGcTypeFull的垃垃圾收集器组成。这里说的合适的垃圾收集器，是指并行性与Heap类的成员变量concurrent_gc_一致，并且类型也与参数gc_type一致的垃圾收集器。 4. 找到合适的垃圾收集器之后，就将参数clear_soft_references的值保存它的成员变量clear_soft_references_中，以便可以告诉它要不要回收被软引用对象引用的对象，然后再调用它的成员函数Run来执行GC。 5. GC执行完毕，将Heap类的成员变量is_gc_running_设置为fals

23、e，以表示当前GC已经执行完毕，下一次请求的GC可以执行了。此外，也会将Heap类的成员变量last_gc_type_设置为当前执行的GC的类型。这样下一次执行GC时，就可以执行另外一个不同类型的GC。例如，如果上一次执行的GC的类型为kGcTypeSticky，那么接下来的两次GC的类型就可以设置为kGcTypePartial和kGcTypeFull，这样可以使得每次都能执行有效的GC。 6. 通过Heap类的成员变量gc_complete_cond_唤醒那些正在等待GC执行完成的线程。在上面的六个步骤中，最重要的就是第四步了。从前面一文可以知道，所有的垃圾收集器都是从GarbageCol

24、lector类继承下来的，因此上面的第四步实际上执行的是GarbageCollector类的成员函数Run，它的实现如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片void GarbageCollector:Run() ThreadList* thread_list = Runtime:Current()-GetThreadList(); uint64_t start_time = NanoTime(); pause_times_.clear(); duration_ns_ = 0; InitializePhase(); if (!IsConcurren

25、t() / Pause is the entire length of the GC. uint64_t pause_start = NanoTime(); ATRACE_BEGIN(Application threads suspended); thread_list-SuspendAll(); MarkingPhase(); ReclaimPhase(); thread_list-ResumeAll(); ATRACE_END(); uint64_t pause_end = NanoTime(); pause_times_.push_back(pause_end - pause_start

26、); else Thread* self = Thread:Current(); ReaderMutexLock mu(self, *Locks:mutator_lock_); MarkingPhase(); bool done = false; while (!done) uint64_t pause_start = NanoTime(); ATRACE_BEGIN(Suspending mutator threads); thread_list-SuspendAll(); ATRACE_END(); ATRACE_BEGIN(All mutator threads suspended);

27、done = HandleDirtyObjectsPhase(); ATRACE_END(); uint64_t pause_end = NanoTime(); ATRACE_BEGIN(Resuming mutator threads); thread_list-ResumeAll(); ATRACE_END(); pause_times_.push_back(pause_end - pause_start); ReaderMutexLock mu(self, *Locks:mutator_lock_); ReclaimPhase(); uint64_t end_time = NanoTim

28、e(); duration_ns_ = end_time - start_time; FinishPhase(); 这个函数定义在文件art/runtime/gc/collector/garbage_collector.cc中。 GarbageCollector类的成员函数Run的实现就对应于图1所示的左边和右边的两个流程。图1所示的左边流程是用来执行非并行GC的，过程如下所示： 1. 调用子类实现的成员函数InitializePhase执行GC初始化阶段。 2. 挂起所有的ART运行时线程。 3. 调用子类实现的成员函数MarkingPhase执行GC标记阶段。 4. 调用子类实现的成员函

29、数ReclaimPhase执行GC回收阶段。 5. 恢复第2步挂起的ART运行时线程。 6. 调用子类实现的成员函数FinishPhase执行GC结束阶段。图1所示的右边流程是用来执行并行GC的，过程如下所示： 1. 调用子类实现的成员函数InitializePhase执行GC初始化阶段。 2. 获取用于访问Java堆的锁。 3. 调用子类实现的成员函数MarkingPhase执行GC并行标记阶段。 4. 释放用于访问Java堆的锁。 5. 挂起所有的ART运行时线程。 6. 调用子类实现的成员函数HandleDirtyObjectsPhase处理在GC并行标记阶段被修改的对象。 7. 恢复

30、第4步挂起的ART运行时线程。 8. 重复第5到第7步，直到所有在GC并行阶段被修改的对象都处理完成。 9. 获取用于访问Java堆的锁。 10. 调用子类实现的成员函数ReclaimPhase执行GC回收阶段。 11. 释放用于访问Java堆的锁。 12. 调用子类实现的成员函数FinishPhase执行GC结束阶段。从上面的分析就可以看出，并行GC和非并行GC的区别在于： 1. 非并行GC的标记阶段和回收阶段是在挂住所有的ART运行时线程的前提下进行的，因此，只需要执行一次标记即可。 2. 并行GC的标记阶段只锁住了Java堆，因此它不能阻止那些不是正在分配对象的ART运行时线程同时运行

31、，而这些同进运行的ART运行时线程可能会引用了一些在之前的标记阶段没有被标记的对象。如果不对这些对象进行重新标记的话，那么就会导致它们被GC回收，造成错误。因此，与非并行GC相比，并行GC多了一个处理脏对象的阶段。所谓的脏对象就是我们前面说的在GC标记阶段同时运行的ART运行时线程访问或者修改过的对象。 3. 并行GC并不是自始至终都是并行的，例如，处理脏对象的阶段就是需要挂起除GC线程以外的其它ART运行时线程，这样才可以保证标记阶段可以结束。从前面一文可以知道，GarbageCollector类有三个直接或者间接的子类MarkSweep、PartialMarkSweep和StickyMa

32、rkSweep都可以用来执行垃圾回收，其中，PartialMarkSweep类又是从MarkSweep类直接继承下来的，而StickyMarkSweep类是从PartialMarkSweep类直接继承下来的。MarkSweep类用来回收Zygote Space和Allocation Space的垃圾，PartialMarkSweep类用来回收Allocation Space的垃圾，StickyMarkSweep类用来回收上次GC以来在Allcation Space上分配的最终又没有被引用的垃圾。接下来，我们就主要分析ART运行时线程的挂起和恢复过程，以及MarkSweep、PartialMa

33、rkSweep和StickyMarkSweep这三个类是执行InitializePhase、MarkingPhase、HandleDirtyObjectsPhase、ReclaimPhase和FinishPhase的五个GC阶段的过程。 1. ART运行时线程的挂起从上面的分析可以知道，ART运行时线程的挂起是通过调用ThreadList类的成员函数SuspendAll实现的，如下所示：cpp view plain copy 在CODE上查看代码片派生到我的代码片void ThreadList:SuspendAll() Thread* self = Thread:Current(); . M

34、utexLock mu(self, *Locks:thread_list_lock_); MutexLock mu2(self, *Locks:thread_suspend_count_lock_); / Update global suspend all state for attaching threads. +suspend_all_count_; / Increment everybodys suspend count (except our own). for (const auto& thread : list_) if (thread = self) continue; . th

35、read-ModifySuspendCount(self, +1, false); / Block on the mutator lock until all Runnable threads release their share of access. #if HAVE_TIMED_RWLOCK / Timeout if we wait more than 30 seconds. if (UNLIKELY(!Locks:mutator_lock_-ExclusiveLockWithTimeout(self, 30 * 1000, 0) UnsafeLogFatalForThreadSuspe

36、ndAllTimeout(self); #else Locks:mutator_lock_-ExclusiveLock(self); #endif . 这个函数定义在文件art/runtime/thread_list.cc中。所有的ART运行时线程都保存在ThreadList类的成员变量list_描述的一个列表，遍历这个列表时，需要获取Lock类的成员变量thread_list_lock_描述的一个互斥锁。 ThreadList类有一个成员变量suspend_all_count_，用来描述全局的线程挂起计数器。在所有的ART运行时线程挂起期间，如果有新的线程将自己注册为ART运行时线程，那么

37、它也会将自己挂起来，而判断所有的ART运行时线程是不是处于挂起期间，就是通过ThreadList类的成员变量suspend_all_count_的值是否大于0进行的。因此，ThreadList类的成员函数SuspendAll在挂起所有的ART运行时线程之前，会将ThreadList类的成员变量suspend_all_count_的值增加1。接下来，ThreadList类的成员函数SuspendAll遍历所有的ART运行时线程，并且调用Thread类的成员函数ModifySuspendCount将它内部的线程计算数器增加1，如下所示：cpp view plain copy 在CODE上查看代码

38、片派生到我的代码片void Thread:AtomicSetFlag(ThreadFlag flag) android_atomic_or(flag, &state_and_flags_.as_int); void Thread:AtomicClearFlag(ThreadFlag flag) android_atomic_and(-1 flag, &state_and_flags_.as_int); . void Thread:ModifySuspendCount(Thread* self, int delta, bool for_debugger) . suspend_count_ +=

39、delta; . if (suspend_count_ = 0) AtomicClearFlag(kSuspendRequest); else AtomicSetFlag(kSuspendRequest); 这三个函数定义在文件art/runtime/thread.cc中。 Thread类的成员函数ModifySuspendCount的实现很简单，它主要就是将成员变量suspend_count_的值增加delta，并且判断增加后的值是否等于0。如果等于0，就调用成员函数AtomicClearFlag将另外一个成员变量state_and_flags_的int值的kSuspendRequest位清

40、0，表示线程没有挂起请求。否则的话，就调用成员函数AtomicSetFlag将成员变量state_and_flags_的int值的kSuspendRequest位置1，表示线程有挂起请求。回到前面ThreadList类的成员函数SuspendAll中，全局ART运行时线程挂起计数器和每一个ART运行时线程内部的线程挂起计数器的操作都是需要在获取Locks类的静态成员变量thread_suspend_count_lock_描述的一个互斥锁的前提下进行的。最后，ThreadList类的成员函数SuspendAll通过获取Locks类的静态成员变量mutator_lock_描述的一个读写锁的写访问来等待所有的ART运行时线程挂起的。这是如何做到的呢？在前面一文中，我们提到，ART运行时提供给由DEX字节码翻译而来的本地机器代码使用的一个函数表中，包含了一个pCheckSuspend函数指针，该函数指针指向了函数CheckSuspendFromCode。于是，每一个ART运行时线程在执行本地机器代码的过程中，就会

展开阅读全文