文章目录
Dig101: dig more, simplified more and know more
今天我们聊聊万物皆可为的接口(interface)的底层设计。
interface被定义为一组方法的签名。
有了它,我们可以订立方法契约,去抽象和约束实现。
而Go的基础类型,可以认为是没有实现任何方法的空interface,也就是万物皆为的interface。
(Go语言没有泛型,接口可以作为一种替代实现)
接口也被寄予厚望,主力开发Russ Cox曾说过:
从语言设计的角度来看,Go的接口是静态的,在编译时检查过的,在需要时是动态的。如果我可以将Go的一个特性导出到其他语言中,那就是接口。
Go Data Structures: Interfaces
那到底interface是怎么设计的底层结构呢?
又怎么支持的duck typing?
在类型断言时又发生了什么?
带着这些问题,我们往下看
0x01 底层结构一样么
我们知道定义接口有这两种方式,那他们底层结构是一样的么?
1 | // 方式1 |
答案是【不一样】
我们用gdb打印下对应类型(gdb相关见Tips-如何优雅的使用GDB调试Go)
1 | // 空接口类型 |
以此可见Go内部定义了两种interface(但都是两个机器字)
eface
空接口,指没有定义方法的接口
内部存储了构造类型(concrete type
)type
和data
iface
有方法的接口
有了相比eface
的type
更丰富的itab
字段,其中记录了构造类型及所实现的interface类型的类型和方法
0x02 类型如何相互转换
如下代码,当我们做接口赋值时,Go又会怎样填充底层结构呢?
1 | type Binary uint64 |
gdb 进到 b = i
这一步,会发现他调用了runtime/iface.go:convT64
方法实现iface的赋值
查阅源码,会发现很多convXXX
函数, 他们是干什么的?
convXXX的命名
convFrom2To
指代 To=From
的转换
From和To的类型有三种:
(参见cmd/compile/internal/types/type.go:Tie
)
- E (eface)
- I (iface)
- T (Type)
这一堆函数看的人眼晕,但参照提交specialize convT2x, don’t alloc for zero vals深入分析,就会清晰许多
起初的convT2{I,E} 和 convI2I
最初只有 convT2{I,E} 和 convI2I
主要实现分配内存(newobject
),然后拷贝赋值(typedmemmove
)
convI2I
还会有getitab
, 具体是什么我们后边类型断言时说
然后也在调用他们前(walkexpr
)做了优化
- 减少值拷贝
ToType为类指针(pointer-shaped
)或者一个机器字内(int
)的话,可以直接存入interface的data字段(主要优化在这里)
pointer-shaped类型: ptr, chan, map, func, unsafe.Pointer
再辅以type的存储,就只是两个字(two-word
)的拷贝
- 减少内存分配
零值,bool/byte
可以不用分配内存,而用已存在值(zerobase,staticbytes
)
只读的全局变量(readonly global
)直接可以用
1kb以内,不escape
到堆上,非interface
的变量可以使用栈上分配的临时变量(stack temporary initialized
)
这类value最后以取地址形式转化为interface: {type/itab, &value}.
- interface转空接口(eface)
可以丢弃除type
以外的itab
1 | tmp = i.itab |
针对类型优化后的convXXX
但这里会有一些可以优化的点,如:
- 分配内存是否可以需要清零?
类指针的类型需要清零,不然内存可能有脏数据
但无指针类型(pointer-free
)如拷贝时直接可以覆盖对应内存则不需要
如int
其拷贝在一个机器字内完成,不需要分配时清零
(32位系统上不调用convT64
,就可以保证访问内存是安全的原子操作)
- 是否可以简化值拷贝?
int,string,slice
这些Type分配的x
拷贝val
时,可以简化为 *(*Type)(x) = val
- 拷贝内存是否可以不增加gc调用(写屏障)?
按ToType类型是否含指针区分
类指针类型(pointer-shaped
): convT2{E,I}
需要拷贝时gc调用(typedmemmove
)
无指针类型(pointer-free
): convT2{E,I}noptr
不需要拷贝时gc调用(memmove
)
这样一看就明白这些函数的用意了,还是为了针对性的提高转化效率
最后结合其调用处convXXX
列表如下:
1 | // cmd/compile/internal/gc/walk.go:walkexpr |
函数(fnname) | From类型 | 值取地址存(needsaddr) |
---|---|---|
convI2I | iface | 否 |
convT{16,32,64} | 底层为整型数据(不含指针,对齐不大于机器字) | 否 |
convTstring | string | 否 |
convTslice | slice | 否 |
convT2E | Type | 是 |
convT2Enoptr | 无指针Type | 是 |
convT2I | Type | 是 |
convT2Inoptr | 无指针Type | 是 |
不会存在 convE2E 和 convE2I
needsaddr: 类型不含指针,大小大于64位字或未知大小时,使用值的地址来存
0x03 类型断言如何实现
interface支持类型断言,来动态判断其构造类型,
判定成功可返回对应构造类型,便于调用其方法
可构造类型实现interface不需要显示声明,
那如下代码是怎么确定interface b
(构造类型是Binary
)实现Stringer
呢?
1 | type Binary uint64 |
调试后会发现,其调用了assertE2I2
这里函数命名有两类,如下
assertE2I: v := eface1.(iface1)
assertE2I2: v,ok := eface1.(iface1)
这里有一点,类型断言非
v,ok
方式的,断言失败会panic)
原来其内部进行了itab
表(itabTable
)查询interface和构造类型的映射表,如果匹配则说明实现
下边代码分析如下
首先初始512个entry的表
1 | const itabInitSize = 512 |
查表是否匹配
在类型断言中调用 getitab(inter, typ, canfail)
查表
- 先不加锁atomic读取itabTable,找到返回
- 未找到加锁再查一遍,找到返回
- 还没有就创建一个itab添加到表中,添加完后解锁
- 期间如果判定不匹配则按是否可以panic(canfail)返回
其中查表用到 itabTable.find(inter, typ)
,
插入用到 itabAdd(m)
尝试插入更新
- 插入前需先用
m.inter/m._type pair
初始化m.fun
数组,不匹配则m.fun[0]==0
(m.fun
类型 [1]uintptr
,实际指向是大小为接口定义方法数的方法数组。详见 func (m *itab) init()
)
用量count超过上限的75%触发扩容,大小为2倍以上(要向上内存对齐),扩容后更新itabTable是原子操作
以itab m的interface类型和构造类型的hash计算对应itabTable的起始偏移,然后插入到其后第一个不为空的entry。如果已存在则直接返回
这里用到了开放地址探测法,公式是:
h(i) = h0 + i*(i+1)/2 mod 2^k
具体插入用到 itabTable.add(m)
这里和其实map插入的逻辑很相似
动态判定效率优化
不过,这里有一个问题?
假定,interface定义了ni
个方法,构造类型实现nt
个方法,
常规匹配构造类型是否实现全部ni
个方法需要两层遍历,复杂度为O(ni*nt)
这样在初始化itab.fun
或类型断言匹配是效率会比较低。
Go设计时也考虑了这个问题,把复杂度降低为O(ni+nt)
这也是使用hashtable的原因之一:
首先interface的函数定义列表
itab.inter.mhdr
和构造类型的函数列表itab.fun
都是按函数名排好序的这样第一次itab初始化时,判定构造类型是否实现函数列表可以
O(ni+nt)
内遍历完成然后用开放地址探测法更新到itabtable中,查询时也可以用同样的方式定位到此itab是否存在。
两个(有序)列表的遍历匹配代码精简如下:
1 | // runtime/iface.go:init() |
总结一下interface的底层设计:
- interface 分为空接口(eface)和接口(iface)两类,但都是两机器字(two-word)存储结构
- interface 转换中针对不同类型做了优化,主要集中于提升内存分配和值拷贝效率
- interface 类型断言时动态判定,利用有序列表遍历+全局哈希表表缓存优化判定效率
See More: 官方解释 InterfaceSlice 为什么不能直接转化
最后留个问题:
下边这段转换代码内部没有调convT64
,为什么?
1 | var b Stringer = Binary(1) |
这个问题下一篇文章再来给出解答。
本文代码见 NewbMiao/Dig101-Go
如有疑问,请文末留言交流或邮件:newbvirgil@gmail.com 本文链接 : https://newbmiao.github.io/2020/02/26/dig101-golang-interface.html