Golang中interface的简单分析

原文地址
版本: GO1.17
接口 Go语言中的接口,是一组方法的签名,它是Go语言的重要组成部分。使用接口能让我们写出易于测试的代码。
然而很多工程师对Go接口的了解都非常有限,也不清楚其底层原理的实现。这成为了开发高性能服务的阻碍。
本文会介绍使用接口时遇到的一些常见问题,以及它的设计与实现,包括接口的类型转换、类型断言以及动态派发机制,
帮助读者更好地理解接口类型。
概述 在计算机科学中,接口是多个组件共享的边界,不同的组件能在边界上交换信息。
如下图所示,接口的本质是引入一个新的中间层。调用方可以通过接口与具体的实现分离。
接触上下游的耦合,上层的模块不在需要依赖下层的具体模块。只需要依赖一个约定好的的接口。

GOLANG INTERFACE ┌────────┐ ┌───────────────?│ module │ │└────────┘ │ ┌────────┐┌─────────┴─┐┌────────┐ │ module ├───────?│ interface ├─────────────?│ module │ └────────┘└─────────┬─┘└────────┘ │ │┌────────┐ └───────────────?│ module │ └────────┘

图1 上下游通过接口解耦
这种面向接口的编程方式有着强大的生命力,无论是在框架中,还是在操作系统中,都能看到接口的身影。
可移植操作系统接口(Portable Operating System Interface, POSIX)就是一个典型的例子,
它定义了应用程序接口和命令行等标准,为计算机软件带来了可移植性,只要操作系统实现了POSIX,
计算机软件就可以在不同操作系统上运行。
除了解耦有依赖关系的上下游,接口还能帮助我们隐藏底层实现,减少关注点。
人能够同时处理的信息非常有限,定义良好的接口能够隔离底层实现,让我们将重点放在当前的代码片段中。
SQL就是接口的一个例子。当我们使用SQL查询数据时,其实不需要关心底层数据库的具体实现,
我们只在乎SQL返回的结果是否符合预期。
SQL AND DATABASE ┌────────┐ ┌───────────────?│ MYSQL│ │└────────┘ │ ┌─────────┴─┐┌────────┐ │SQL├─────────────?│ SQLITE │ └─────────┬─┘└────────┘ │ │┌────────────┐ └───────────────?│ POSTGRESQL │ └────────────┘

图2 SQL和不同数据库
类型
接口也是GO语言中的一种类型,它能够出现在变量的定义,函数的入参和放回值上。
GO语言中有两种略微不同的接口,一种是带一组方法的接口,另一种是不带任何方法的接口。
GOLANG DIFFERENT INTERFACE┌─────────┐┌────────┐ │iface ││ eface│ └─────────┘└────────┘

图3 Go 语言中的两种接口
Go语言使用runtime.iface表示带有一组方法的接口,使用runtime.eface表示不带任何方法的接口。
需要注意的是interface{}不是任意类型,如果我们将类型转换成了interface{}类型,
变量在运行期间的类型也会发生变化。
我们可以通过一个例子理解Go 语言的接口类型不是任意类型这一句话,下面的代码在 main 函数中初始化了一个 *Test 类型的变量,由于指针的零值是 nil,所以变量 s 在初始化之后也是 nil
package maintype Test struct{}func main() { var v *Test println(v == nil) // true var i interface{} = v println(i == nil) // false }

由此可见,变量的赋值会触发隐式类型转换,在类型转换时,*Test会被转换成interface{}
转换后的变量,不仅包含转换前的变量,还包含变量的类型信息。所以转换后的变量不等于nil
数据结构 我们从源代码和汇编的角度分析一下接口的底层数据结构。
Go语言根据接口是否包含一组方法,将接口分为两类:
  1. 使用runtime.iface表示包含方法的接口
  2. 使用runtime.eface表示不包含方法的接口
runtime.eface在Go语言中的定义如下:
type eface struct { // 16 字节 _type *_type dataunsafe.Pointer }

这个结构相对简单,只包含类型和数据,从上述结构我们能推断出
Go语言的任意类型能转都能换成 runtime.eface
另一个用于表示接口的结构体是runtime.iface,这个结构体也有指向原始数据的指针 data
不过更重要的是runtime.itab类型的tab字段
type iface struct { // 16 字节 tab*itab data unsafe.Pointer }

接下来我们将分析Go语言中的这两个接口类型
类型结构体
runtime._type是Go语言类型的运行时表示,下面是runtime包中的结构体,
其中包含了很多类型的元信息,例如类型的大小、哈希、对齐以及种类等
type _type struct { sizeuintptr // 存储了类型的占用空间,为内存空间的分配提供信息 ptrdatauintptr hashuint32// 字段能够帮助我们快速确定类型是否相等 tflagtflag alignuint8 fieldAlign uint8 kinduint8 equalfunc(unsafe.Pointer, unsafe.Pointer) bool // 字段用于判断当前类型的多个对象是否相等 gcdata*byte strnameOff ptrToThistypeOff }

我们只需要对runtime._type结构体中的字段有个大体的概念,不需要详细理解每个字段的作用和意义。
itab 结构体
runtime.itab结构体是接口类型的核心组成部分,共占32字节,我们可以把其看成是接口类型和具体类型的组合
inter字段表示接口类型,_type字段表示具体类型
type itab struct { // 32 字节 inter *interfacetype _type *_type hashuint32 _[4]byte fun[1]uintptr }

除了inter_type两个字段外,上述结构体的另外两个字段也有自己的作用:
  • hash是对_type.hash的拷贝,当我们想将interface类型转成具体类型时,可以使用该字段快速判断目标类型和具体类型的runtime._type是否一致
  • fun是一组方法的首地址,配合inter中的方法集使用,可以方便的定位到_type实现的方法地址
我们会在类型断言中介绍hash的使用,在动态派发中介绍fun的使用
类型断言 本节会根据接口是否包含方法分两种情况介绍类型断言的执行过程。
非空接口
首先分析非空接口,Person是一个包含方法的非空接口,我们来分析从
Person转换回Chinese结构体的过程
func main() { var p Person = &Chinese{Name: "chinese"} switch p.(type) { case *Chinese: chinese := p.(*Chinese) chinese.GetName() } }

我们将编译得到的汇编指令分成两部分,第一部分是变量的初始化,第二部门是
类型断言。
第一部分代码如下:
00000TEXT"".main(SB), ABIInternal, $136-0 ...... 00038MOVUPSX15, ""..autotmp_6+112(SP); ; 清空(112-128)(SP) ...... 00056MOVQ$7, ""..autotmp_6+120(SP); ; +120(SP) = 7 00065LEAQgo.string."chinese"(SB), SI; ; SI = &("chinese") 00072MOVQSI, ""..autotmp_6+112(SP); ; +112(SP) = SI = &("chinese") ...... 00082LEAQgo.itab.*"".Chinese,"".Person(SB), SI; ; SI = &(go.itab.*"".Chinese,"".Person(SB)) 00089MOVQSI, "".p+80(SP); ; +80(SP) = SI = &(go.itab.*"".Chinese,"".Person(SB)) 00044LEAQ""..autotmp_6+112(SP), DX; ; DX = &(+112(SP)) 00094MOVQDX, "".p+88(SP); ; +88(SP) = DX = &(+112(SP))

上面的代码初始化了Person变量,Chinese结构体初始化在 (112-128)(SP) 上。
(112-120)(SP)上存的是 go.string."chinese"(SB) .也就是字符串"chinese"的地址
(120-128)(SP)上存的是 长度7
Person变量初始化在 (80-96)(SP) 上。
下面进入类型转换的部分:
00099MOVQ"".p+80(SP), DX; ; DX = &(go.itab.*"".Chinese,"".Person(SB)) 00104MOVQ"".p+88(SP), SI; ; SI = &(+112(SP)) = "chinese" 00126MOVL16(DX), DX; ; DX = &(go.itab.*"".Chinese,"".Person(SB)).hash 00133CMPLDX, $-1430607797; ; if (p.hash == *"".Chinese.hash)

switch语句生成的汇编指令会将目标类型的 hash 与接口变量中的 itab.hash 进行比较:
如果二者相等,说明断言成功,可以走入分支,如果不相等,说明p变量不是*Chinese类型。
空接口
当我们使用空接口类型 interface{} 进行类型断言时,编译器从 eface._type 中获取,汇编指令仍然会使用目标类型的 hash 与变量的类型比较
func main() { var p interface{} = &Chinese{Name: "chinese"} switch p.(type) { case *Chinese: chinese := p.(*Chinese) chinese.GetName() } }

动态派发 动态派发是在运行期间选择具体方法执行的过程。调用接口类型的方法时,如果编译期不能确认接口的类型,Go语言会在运行期决定调用该方法的哪个实现。
func main() { var p Person = &Chinese{Name: "chinese"} PrintName(p) }func PrintName(p Person) { name1 := p.GetName() fmt.Println(name1) }

主要来看动态派发的过程
00000TEXT"".PrintName(SB), ABIInternal, $208-16 00038MOVQAX, "".p+216(SP); ; "".p+216(SP) = iface.tab 00046MOVQBX, "".p+224(SP); ; "".p+224(SP) = iface.data 00056MOVQ24(AX), CX; ; CX = iface(p).tab.fun[0] = *Chinese.GetName 00060MOVQBX, AX; ; AX = iface(p).data = https://www.it610.com/article/(&Chinese{Name:"chinese"}) 00064CALLCX; ; (&Chinese{Name: "chinese"}).GetName()

PrintName函数接受参数为Person接口 p ,也就是一个iface结构体实例,根据1.17的调用规约,
寄存器AX,BX分别存的是iface.tab以及iface.data, 【00056】的24(AX) 是iface.tab.fun[0]
【00064】实际就是接口方法真实调用的地方。
至于【00038】【00046】为什么要把参数存起来,是因为调用接口方法后,返回值会覆盖AX,BX的值。
【Golang中interface的简单分析】传送门

    推荐阅读