go语言结构体字节对齐 go语言结构体和复杂json( 三 )


`key1:"value1" key2:"value2"`
结构体标签由一个或多个键值对组成 。键与值使用冒号分隔,值用双引号括起来 。键值对之间使用一个空格分隔 。注意事项:为结构体编写Tag时,必须严格遵守键值对的规则 。结构体标签的解析代码的容错能力很差,一旦格式写错 , 编译和运行时都不会提示任何错误,通过反射也无法正确取值 。例如不要在key和value之间添加空格 。
例如我们为Student结构体的每个字段定义json序列化时使用的Tag:
golang 结构体 字节对齐是怎么样的用golang解析二进制协议时,其实没必要管结构体的字段的对齐规则,何况语言规范也没有规定如何对齐 , 也就是没有规则 。用encoding/binary.Read函数直接读入struct里就行,struct就像c那样写
type Data struct {
Size, MsgType uint16
Sequence uint32
// ...
}
golang编译器加不加padding,Read都能正常工作,runtime知道Data的布局的 , 不像C直接做cast所以要知道怎样对齐 。
用unsafe.Alignof可以知道每个field的对齐长度,但没必要用到 。
package main
/*
#include stdint.h
#pragma pack(push, 1)
typedef struct {
uint16_t size;
uint16_t msgtype;
uint32_t sequnce;
uint8_t data1;
uint32_t data2;
uint16_t data3;
} mydata;
#pragma pack(pop)
mydata foo = {
1, 2, 3, 4, 5, 6,
};
int size() {
return sizeof(mydata);
}
*/
import "C"
import (
"bytes"
"encoding/binary"
"fmt"
"log"
"unsafe"
)
func main() {
bs := C.GoBytes(unsafe.Pointer(C.foo), C.size())
fmt.Printf("len %d data %v\n", len(bs), bs)
var data struct {
Size, Msytype uint16
Sequenceuint32
Data1uint8
Data2uint32
Data3uint16
}
err := binary.Read(bytes.NewReader(bs), binary.LittleEndian, data)
if err != nil {
log.Fatal(err)
}
fmt.Printf("%v\n", data) // {1 2 3 4 5 6}
buf := new(bytes.Buffer)
binary.Write(buf, binary.BigEndian, data)
fmt.Printf("%d %v\n", buf.Len(), buf.Bytes()) // 15 [0 1 0 2 0 0 0 3 4 0 0 0 5 0 6]
}
Go语言中恰到好处的内存对齐 在开始之前,希望go语言结构体字节对齐你计算一下Part1共占用go语言结构体字节对齐的大小是多少呢go语言结构体字节对齐?
输出结果:
这么一算 ,  Part1这一个结构体的占用内存大小为 1+4+1+8+1 = 15 个字节 。相信有的小伙伴是这么算的,看上去也没什么毛病
真实情况是怎么样的呢?我们实际调用看看,如下:
输出结果:
最终输出为占用 32 个字节 。这与前面所预期的结果完全不一样 。这充分地说明go语言结构体字节对齐了先前的计算方式是错误的 。为什么呢?
在这里要提到 “内存对齐” 这一概念,才能够用正确的姿势去计算 , 接下来我们详细的讲讲它是什么
有的小伙伴可能会认为内存读取,就是一个简单的字节数组摆放
上图表示一个坑一个萝卜的内存读取方式 。但实际上 CPU 并不会以一个一个字节去读取和写入内存 。相反 CPU 读取内存是 一块一块读取 的 , 块的大小可以为 2、4、6、8、16 字节等大小 。块大小我们称其为 内存访问粒度。如下图:
在样例中 , 假设访问粒度为 4 。CPU 是以每 4 个字节大小的访问粒度去读取和写入内存的 。这才是正确的姿势
另外作为一个工程师 , 你也很有必要学习这块知识点哦 :)
在上图中,假设从 Index 1 开始读?。岢鱿趾鼙览5奈侍?。因为它的内存访问边界是不对齐的 。因此 CPU 会做一些额外的处理工作 。如下:

推荐阅读