Go 服务调试精解
生产环境总是会遇到一些奇怪的问题,比如 Go 服务时不时地响应非常慢甚至完全没有响应,Go 服务的内存占用总是居高不下等。遇到这些问题该如何排查与分析呢?Go 语言其实为我们提供了一些非常有用的工具,如 ppprof、Trace,这两种工具可以帮助我们分析和解决 Go 服务的性能问题。另外,学习 C 语言的读者可能知道 GDB 可以用来调试 C 程序,那么 Go 语言有没有对应的调试工具呢? Go 语言专用的调试工具叫作 dlv。
1. Go 程序分析利器 ppprof
pprof 是 Go 语言提供的一款非常强大的性能分析工具,它可以收集 Go 程序的各项运行时指标数据,包括内存、CPU、锁等。有了这些指标数据,大部分的 Go 服务性能问题也就可以迎刃而解了。
1.1 pprof 概述
为什么 pprof 可以帮助我们分析 Go 程序的性能呢?因为它可以采集 Go 服务的运行时数据,比如协程调用栈、内存分配情况等。这样一来,我们就能清楚地知道 Go 服务在哪里阻塞,在哪里消耗内存。当然,要想通过 pprof 分析程序性能,需要引入一点代码,如下所示:
package main
import (
"net/http"
_"net/http/pprof"
)
func main(){
go func(){
http.ListenAndServe("0.0.0.0:6060",nil)
}()
}
参考上面的官方说明,可以看到,pprof 工具可以用来分析内存溢出问题、协程溢出问题、锁/阻塞问题等。那么如何应用这些数据指标呢?举一个例子,指标 goroutine 可以采集所有协程的调用栈,通常可以用来分析 Go 服务的阻塞情况,比如当大量协程阻塞在获取锁的代码时,那是不是有可能是因为锁没有被释放?再比如当大量协程阻塞在写管道的代码时,那是不是有可能是因为读管道的协程太慢或者异常退出了?goroutine 指标的输出内容如下所示:
http://127.0.0.1:8888/debug/pprof/goroutine?debug=1
//第一个数字表示协程数
1 @ 0x10390d6 0x1032357 0x1063929 0x10d0372 0x10d16da 0x10d16c8 0x1126c29 0x1135d85 0x131dc9f 0x1069921
# 0x1063928 internal/poll.runtime_pollWait+0x88 /go1.23/src/runtime/netpoll.go:302
# 0x10d0371 internal/poll.(*pollDesc).wait+0x31 /go1.23/src/internal/poll/fd_poll_runtime.go:83
# 0x10d16d9 internal/poll.(*pollDesc).waitRead+0x259 /go1.23/src/internal/poll/fd_poll_runtime.go:88
# 0x10d16c7 internal/poll.(*FD).Read+0x247 /go1.23/src/internal/poll/fd_unix.go:167
# 0x1126c28 net.(*netFD).Read+0x28 /go1.23/src/net/fd_posix.go:55
# 0x1135d84 net.(*conn).Read+0x44 /go1.23/src/net/net.go:183
# 0x131dc9e net/http.(*connReader).backgroundRead+0x3e /go1.23/src/net/http/server.go:672
......
最后思考一个问题:为什么只需要引入 net/http/pprof 就能采集这些运行时数据指标呢?回顾一下上面的程序示例,我们还启动了一个HTTP服务,但是我们没有设置 HTTP 请求的处理器,那么当我们在浏览器中输入地址 “/debug/pprof" 时,该请求由谁处理了呢?其实在引入 net/http/pprof包的时候,其声明的 init 函数就默认注册好了 HTTP 请求处理器,所以我们才能通过这些接口获取到运行时数据指标,如下所示:
func init() {
//前缀匹配,包含allocs、heap、goroutine等
http.HandleFunc("/debug/pprof/", Index)
http.HandleFunc("/debug/pprof/cmdline", Cmdline)
http.HandleFunc("/debug/pprof/profile", Profile)
http.HandleFunc("/debug/pprof/symbol", Symbol)
http.HandleFunc("/debug/pprof/trace", Trace)
}
1.2 内存指标分析
内存指标可以通过地址 “/debug/pprof/heap" 或者 “/debug/pprof/allocs" 查看,这两种指标采样的数据基要上是一样的,只是指标 heap 可以用来采样存活对象的内存分配情况(可通过参数 gc=1 在采样前运行 GC, 这样剩下的都是存活对象了)。以指标 heap 为例,其输出结果如下所示:
//访问地址
http://127.0.0.1:6060/debug/pprof/heap?debug=1&gc=1
//heap profile 汇总数据:
//3: 29728 [16: 54144] 含义如下:
//inuse对象数目(已分配的,去除了已释放的): inuse字节 [已分配对象数目: 已分配字节]
//heap/1048576 平均采样频率1048576字节
heap profile: 10: 29728 [16: 54144] &