Go 语言的垃圾回收机制
- Go 语言的垃圾回收机制(Garbage Collection,简称 GC)
- 1. 垃圾回收的工作原理
- 2. 并发与回收
- 3. 优点和缺点
- 4. 调整和监控
- 在 Go 语言中,垃圾回收(GC)机制主要通过“引用计数”和“可达性分析”来判断资源是否需要回收。
- 1. 可达性分析
- 2. 触发垃圾回收的条件
- 3. 捡垃圾的标准
- 对象树
- 对象树的基本概念
- 对象树的挂载
- 对象树与内存管理
- 4. 影响垃圾回收
Go 语言的垃圾回收机制(Garbage Collection,简称 GC)
是一种自动的内存管理方法,它负责自动释放不再使用的内存,以避免内存泄漏和碎片化。Go 的垃圾回收机制设计目的在于简化开发者的内存管理工作,同时保持程序的高效性。
1. 垃圾回收的工作原理
Go 使用了一种称为标记-清除(mark-and-sweep)的算法进行垃圾回收,这一过程通常包括以下几个步骤:
标记阶段:
GC 从根对象(如全局变量、活跃的 goroutines 和栈上的变量)开始,递归地遍历所有可达对象。
遍历过程中,将所有可以被访问到的对象标记为活跃(即仍然在使用的对象)。
清除阶段:
遍历所有对象,清除未被标记的对象(不再可达的对象),并回收其占用的内存。
2. 并发与回收
Go 的垃圾回收机制是并发的,意味着它能够在程序运行时自动进行垃圾回收,不会暂停整个程序。这种设计减少了“停顿”时间,使其对性能的影响更小。
G1 垃圾回收器(Go 1.5 中引入):支持同时执行的标记和清理过程,从而在后台工作,减少暂停时间。
三色标记法:使用三种颜色(白色、灰色、黑色)来表示对象的状态,以控制标记过程。
3. 优点和缺点
优点:
自动内存管理:开发者无需手动管理内存分配和释放,降低了内存泄漏的风险。
简化开发:简化了代码的复杂性,提高了开发效率。
缺点:
性能负担:GC 的开销可能在内存使用高峰期或需要频繁进行回收时引入延迟。
不可预测的停顿时间:尽管 Go 的 GC 尽量减少停顿时间,但仍然可能在某些情况下导致不可预测的延迟。
4. 调整和监控
Go 提供了一些运行时参数,让开发者可以监控和调整垃圾回收行为,例如:
环境变量 GOGC:用于设置垃圾回收的目标百分比。可以通过调整此变量来影响 GC 的频率,默认值为 100。
运行时监控:可以使用 runtime.ReadMemStats 来获取内存使用情况和 GC 相关的统计信息。
在 Go 语言中,垃圾回收(GC)机制主要通过“引用计数”和“可达性分析”来判断资源是否需要回收。
1. 可达性分析
Go 语言使用的是标记-清除(mark-and-sweep)垃圾回收算法,
其核心思想是通过“可达性分析”来判断哪些对象是仍然可用的,哪些是可以安全回收的。以下是具体步骤:
根对象:GC 从根对象开始,包括全局变量、栈上的变量和正在执行的 goroutine。
对象树遍历:GC 会递归地遍历从这些根对象可达的所有对象(通过指针引用)。在遍历过程中,“标记”所有被访问到的对象为“活跃的”(可用的)。
标记阶段:所有通过根对象可达的对象都被标记,代表它们仍在使用中。
清除阶段:在标记结束后,所有未被标记的对象将被视为不再可用,GC 会释放这些对象占用的内存。
2. 触发垃圾回收的条件
Go 的垃圾回收是自动的,会在特定条件下触发:
内存使用量:内存使用量超过一定的阈值时,垃圾回收会被触发。
Go 使用环境变量 GOGC 来调整垃圾收集的目标百分比,默认值为 100,
即当已分配的内存大小与垃圾回收前的内存使用量的比例达到 100% 时,会触发 GC。
分配新对象:在分配新的对象时,Go 会检查当前的内存使用情况,并可能触发垃圾回收,以确保有足够的内存空间。
手动触发:开发者可以使用 runtime.GC() 函数在代码中手动触发垃圾回收。
3. 捡垃圾的标准
为了判断一个对象是否可以被回收,GC 需要遵循一些标准:
可达性:如果一个对象从根对象不可达,则该对象会被判定为“可回收”。
指针引用:在遍历过程中,如果一个对象包含指向其他对象的引用,GC 会跟随这些指针以标记出所有可达对象。
对象树
“对象树”这个概念通常指的是在内存中由对象(如结构体、切片、映射等)组成的层级结构。
这种结构有助于理解对象之间的关系,以及它们在垃圾回收时如何被标记和管理。
对象树的基本概念
根对象(Root Objects):
垃圾回收从一些称为根对象的起始点开始。根对象通常包括全局变量、栈上的局部变量和正在执行的 goroutines。
任何可以从应用程序的“根”访问到的对象都被称为可达的。
边(Edges):
在对象树中,对象之间通过指向其他对象的指针构成关系。
这些指向其他对象的指针被称为“边”。
每当一个对象列表或切片包含指向其他对象的指针时,就形成了更多的对象层级。
标记和遍历:
在垃圾回收时,GC 理论上会从这些根对象开始,通过访问指针来标记所有与之可达的对象,
以构建出可达性图,再从图中识别出不可达的对象。
对象树的挂载
基本类型变量(如 int, float64, string 等):
当你声明一个基本类型的变量时,它本身不会直接挂载到对象树,
因为基本类型的值不包含对其他对象的引用。基本类型的值是堆栈上简单的原始数据。
var a int = 10 // 基本类型变量不在对象树中
切片、映射、通道、接口、指针等引用类型:
当你声明类似切片、映射或者其他引用类型的变量时,虽然你变量的值在栈上,
但它包含的指针或引用将使它在对象树中占有一席之地。这是因为这些类型指向分配在堆上的数据。
// 切片类型变量,挂载到对象树
slice := []int{1, 2, 3}
对象树与内存管理
挂载到对象树:当一个变量(尤其是引用类型)持有对新的对象的引用时(如切片、映射和结构体),
复杂的对象结构会变得可达,这会影响垃圾回收(GC)机制。
GC 会从根对象开始遍历整个对象树,找到所有可达的对象。
4. 影响垃圾回收
一个变量只要是从根对象可达的,它就会被 GC 标记为活跃。
当你声明的变量不再可达时(例如超出作用域),它最终将被标记为可回收。
此时,变量所持有的任何引用类型的对象也会根据指针关系与其他对象的可达状态决定其存活状态。