您现在的位置是：网站首页> 编程资料编程资料

Go defer 原理和源码剖析(推荐)_Golang_

2023-05-26 618人已围观

简介 Go defer 原理和源码剖析(推荐)_Golang_

1. 编译器编译 defer 过程

defer dosomething(x)

简单来说，执行 defer 语句，实际上是注册了一个稍后执行的函数，确定了函数名和参数，但不会立即调用，而是把调用过程推迟到当前函数 return 或者发生 panic 的时候。

我们先了解一下 defer 相关的数据结构。

1) struct _defer 数据结构

go 语言程序中每一次调用 defer 都生成一个 _defer 结构体。

 type _defer struct { siz int32 // 参数和返回值的内存大小 started boul heap boul // 区分该结构是在栈上分配的，还是对上分配的 sp uintptr // sp 计数器值，栈指针； pc uintptr // pc 计数器值，程序计数器； fn *funcval // defer 传入的函数地址，也就是延后执行的函数; _panic *_panic // panic that is running defer link *_defer // 链表 }

我们默认使用了 go 1.13 版本的源代码，其它版本类似。

一个函数内可以有多个 defer 调用，所以自然需要一个数据结构来组织这些 _defer 结构体。_defer 按照对齐规则占用 48 字节的内存。在 _defer 结构体中的 link 字段，这个字段把所有的 _defer 串成一个链表，表头是挂在 Goroutine 的 _defer 字段。

_defer 的链式结构如下：

_defer.siz 用于指定延迟函数的参数和返回值的空间，大小由 _defer.siz 指定，这块内存的值在 defer 关键字执行的时候填充好。

defer 延迟函数的参数是预计算的，在栈上分配空间。每一个 defer 调用在栈上分配的内存布局如下图所示：

其中 _defer 是一个指针，指向一个 struct _defer 对象，它可能分配在栈上，也可能分配在堆上。

2) struct _defer 内存分配

以下是一个使用 defer 的范例，文件名为 test_defer.go：

 package main func doDeferFunc(x int) { println(x) } func doSomething() int { var x = 1 defer doDeferFunc(x) x += 2 return x } func main() { x := doSomething() println(x) }

编译以上代码，加上去除优化和内链选项：

go tool compile -N -l test_defer.go

导出汇编代码：

go tool objdump test_defer.o

我们看下编译成的二进制代码：

从汇编指令我们看到，编译器在遇到 defer 关键字的时候，添加了一些运行库函数：deferprocStack和deferreturn。

go 1.13 正式版本的发布提升了 defer 的性能，号称针对 defer 场景提升了 30% 的性能。

go 1.13 之前的版本 defer 语句会被编译器翻译成两个过程：回调注册函数过程：deferproc和deferreturn

。

go 1.13 带来的 deferprocStack 函数，这个函数就是这个 30% 性能提升的核心手段。deferprocStack 和 deferproc 的目的都是注册回调函数，但是不同的是 deferprocStatck 是在栈内存上分配 struct _defer 结构，而 deferproc 这个是需要去堆上分配结构内存的。而我们绝大部分的场景都是可以是在栈上分配的，所以自然整体性能就提升了。栈上分配内存自然是比对上要快太多了，只需要改变 rsp 寄存器的值就可以进行分配。

那么什么时候分配在栈上，什么时候分配在堆上呢？

在编译器相关的文件（src/cmd/compile/internal/gc/ssa.go ）里，有个条件判断：

 func (s *state) stmt(n *Node) { case ODEFER: d := callDefer if n.Esc == EscNever { d = callDeferStack } }

n.Esc 是 ast.Node 的逃逸分析的结果，那么什么时候 n.Esc 会被置成 EscNever 呢？

这个在逃逸分析的函数 esc 里（src/cmd/compile/internal/gc/esc.go ）：

 func (e *EscState) esc(n *Node, parent *Node) { case ODEFER: if e.loopdepth == 1 { // top level n.Esc = EscNever // force stack allocation of defer record (see ssa.go) break } }

这里 e.loopdepth 等于 1的时候，才会设置成 EscNever ，e.loopdepth 字段是用于检测嵌套循环作用域的，换句话说，defer 如果在嵌套作用域的上下文中，那么就可能导致 struct _defer 分配在堆上，如下：

 package main func main() { for i := 0; i < 10; i++ { defer func() { _ = i }() } }

编译器生成的则是 deferproc ：

当 defer 外层出现显式（for）或者隐式（goto）的时候，将会导致 struct _defer 结构体分配在堆上，性能就会变差，这个编程的时候要注意。

编译器就能决定 _defer 结构体分配在栈上还是堆上，对应函数分别是 deferprocStatck 和 deferproc 函数，这两个函数都很简单，目的一致：分配出 struct _defer 的内存结构，把回调函数初始化进去，挂到链表中。

3) deferprocStack 栈上分配

deferprocStack 函数做了哪些事情呢？

 // 进入这个函数之前，就已经在栈上分配好了内存结构 func deferprocStack(d *_defer) { gp := getg() // siz 和 fn 在进入这个函数之前已经赋值 d.started = false // 表明是栈的内存 d.heap = false // 获取到 caller 函数的 rsp 寄存器值，并赋值到 _defer 结构 sp 字段中 d.sp = getcallersp() // 获取到 caller 函数的 rip 寄存器值，并赋值到 _defer 结构 pc 字段中 // 根据函数调用的原理，我们就知道 caller 的压栈的 pc (rip) 值就是 deferprocStack 的下一条指令 d.pc = getcallerpc() // 把这个 _defer 结构作为一个节点，挂到 goroutine 的链表中 *(*uintptr)(unsafe.Pointer(&d._panic)) = 0 *(*uintptr)(unsafe.Pointer(&d.link)) = uintptr(unsafe.Pointer(gp._defer)) *(*uintptr)(unsafe.Pointer(&gp._defer)) = uintptr(unsafe.Pointer(d)) // 注意，特殊的返回，不会触发延迟调用的函数 return0() }

小结：

由于是栈上分配内存的，所以调用到 deferprocStack 之前，编译器就已经把 struct _defer 结构的函数准备好了；
_defer.heap 字段用来标识这个结构体分配在栈上；
保存上下文，把 caller 函数的 rsp，pc（rip）寄存器的值保存到 _defer 结构体；
_defer 作为一个节点挂接到链表。注意：表头是 goroutine 结构的 _defer 字段，而在一个协程任务中大部分有多次函数调用的，所以这个链表会挂接一个调用栈上的 _defer 结构，执行的时候按照 rsp 来过滤区分；4) deferproc 堆上分配

堆上分配的函数为 deferproc ，简化逻辑如下：

 func deferproc(siz int32, fn *funcval) { // arguments of fn fullow fn // 获取 caller 函数的 rsp 寄存器值 sp := getcallersp() argp := uintptr(unsafe.Pointer(&fn)) + unsafe.Sizeof(fn) // 获取 caller 函数的 pc（rip） 寄存器值 callerpc := getcallerpc() // 分配 struct _defer 内存结构 d := newdefer(siz) if d._panic != nil { throw("deferproc: d.panic != nil after newdefer") } // _defer 结构体初始化 d.fn = fn d.pc = callerpc d.sp = sp switch siz { case 0: // Do nothing. case sys.PtrSize: *(*uintptr)(deferArgs(d)) = *(*uintptr)(unsafe.Pointer(argp)) default: memmove(deferArgs(d), unsafe.Pointer(argp), uintptr(siz)) } // 注意，特殊的返回，不会触发延迟调用的函数 return0() }

小结：

与栈上分配不同，struct _defer 结构是在该函数里分配的，调用 newdefer 分配结构体，newdefer 函数则是先去 poul 缓存池里看一眼，有就直接取用，没有就调用 mallocgc 从堆上分配内存；
deferproc 接受入参 siz，fn ，这两个参数分别标识延迟函数的参数和返回值的内存大小，延迟函数地址；
_defer.heap 字段用来标识这个结构体分配在堆上；
保存上下文，把 caller 函数的 rsp，pc（rip）寄存器的值保存到 _defer 结构体；
_defer 作为一个节点挂接到链表；

5) 执行 defer 函数链

编译器遇到 defer 语句，会插入两个函数：

分配函数：deferproc 或者 deferprocStack ；
执行函数：deferreturn 。

包裹 defer 语句的函数退出的时候，由 deferreturn 负责执行所有的延迟调用链。

 func deferreturn(arg0 uintptr) { gp := getg() // 获取到最前的 _defer 节点 d := gp._defer // 函数递归终止条件（d 链表遍历完成） if d == nil { return } // 获取 caller 函数的 rsp 寄存器值 sp := getcallersp() if d.sp != sp { // 如果 _defer.sp 和 caller 的 sp 值不一致，那么直接返回； // 因为，就说明这个 _defer 结构不是在该 caller 函数注册的 return } switch d.siz { case 0: // Do nothing. case sys.PtrSize: *(*uintptr)(unsafe.Pointer(&arg0)) = *(*uintptr)(deferArgs(d)) default: memmove(unsafe.Pointer(&arg0), deferArgs(d), uintptr(d.siz)) } // 获取到延迟回调函数地址 fn := d.fn d.fn = nil // 把当前 _defer 节点从链表中摘除 gp._defer = d.link // 释放 _defer 内存（主要是堆上才会需要处理，栈上的随着函数执行完，栈收缩就回收了） freedefer(d) // 执行延迟回调函数 jmpdefer(fn, uintptr(unsafe.Pointer(&arg0))) }

代码说明：

遍历 defer 链表，一个个执行，顺序链表从前往后执行，执行一个摘除一个，直到链表为空；
jmpdefer 负责跳转到延迟回调函数执行指令，执行结束之后，跳转回 deferreturn 里执行；
_defer.sp 的值可以用来判断哪些是当前 caller 函数注册的，这样就能保证只执行自己函数注册的延迟回调函数；

例如，a() -> b() -> c() ，a 调用 b，b 调用 c ，而 a，b，c 三个函数都有 defer 注册延迟函数，那么自然是 c()函数返回的时候，执行 c 的回调；

2. defer 传递参数

1) 预计算参数

在前面描述 _defer 数据结构的时候说到内存结构如下：

_defer 在栈上作为一个 header，延迟回调函数（ defer ）的参数和返回值紧接着 _defer 放置，而这个参数值是在 defer 执行的时候就设置好了，也就是预计算参数，而非等到执行 defer 函数的时候才去获取。

举个例子，执行 defer func(x, y) 的时候，x，y 这两个实参是计算的出来的，Go 中的函数调用都是值传递。那么就会把 x，y 的值拷贝到 _defer 结构体之后。再看个例子：

 package main func main() { var x = 1 defer println(x) x += 2 return }

这个程序输出是什么呢？是 1 ，还是 3 ？答案是：1 。defer 执行的函数是 println ，println 参数是 x ，x 的值传进去的值则是在 defer 语句执行的时候就确认了的。

2) defer 的参数准备

defer 延迟函数执行的参数已经保存在和 _defer 一起的连续内存块了。那么执行 defer 函数的时候，参数是哪里来呢？当然不是直接去 _defer 的地址找。因为这里是走的标准的函数调用。

在 Go 语言中，一个函数的参数由 caller 函数准备好，比如说，一个 main() -> A(7) -> B(a) 形成类似以下的栈帧：

所以，deferreturn 除了跳转到 defer 函数指令，还需要做一个事情：把 defer 延迟回调函数需要的参数准备好（空间和值）。那么就是如下代码来做的视线：

 func deferreturn(arg0 uintptr) { switch d.siz { case 0: // Do nothing. case sys.PtrSize: *(*uintptr)(unsafe.Pointer(&arg0)) = *(*uintptr)(deferArgs(d)) default: memmove(unsafe.Pointer(&arg0), deferArgs(d), uintptr(d.siz)) } }

arg0 就是 caller 用来放置 defer 参数和返回值的栈地址。这段代码的意思就是，把 _defer 预先的准备好的参数，copy 到 caller 栈帧的某个地址（arg0）。

3. 执行多条 defer

前面已经详细说明了，_defer 是一个链表，表头是 goroutine._defer 结构。一个协程的函数注册的是挂同一个链表，执行的时候按照 rsp 来区分函数。并且，这个链表是把新元素插在表头，而执行的时候是从前往后执行，所以这里导致了一个 LIFO 的特性，也就是先注册的 defer 函数后执行。