c语言if语句是如何变成汇编代码的()

1. 要编译的测试代码:

int a; int b = 3; int main(void) { if (3) a = 4; else b = 5; }


2. 词法分析
词法分析将c源代码解析成一个个的token。
关键的,将if两个字符解析成一个if token,后续语法分析的输入就从两个字符减少为1个token,减小了语法分析的难度。

3. 语法分析
if (equal(tok, "if")) { Node *node = new_node(ND_IF, tok); tok = skip(tok->next, "("); node->cond = expr(&tok, tok); tok = skip(tok, ")"); node->then = stmt(&tok, tok); if (equal(tok, "else")) node->els = stmt(&tok, tok->next); *rest = tok; return node; }


如果当前处理的token是if,则
3.1创建新的类型为ND_IF的node。

3.2跳过if后面的"("。

3.3调用expr函数解析if语句()中的表达式,并将解析结果存储在node->cond。

3.4跳过“)”。

3.5调用stmt处理then语句块中的语句,这里是处理"a = 4; ",将解析结果存储在node->then。

3.6如果if语句还有else部分,则调用stmt处理else语句块中的语句,这里是处理"b = 5; ",将解析结果存储在node->els。

3.7node->cond,node->then,node->els都为node节点。

4. 代码生成
switch (node->kind) { case ND_IF: { int c = count(); gen_expr(node->cond); cmp_zero(node->cond->ty); println("je.L.else.%d", c); gen_stmt(node->then); println("jmp .L.end.%d", c); println(".L.else.%d:", c); if (node->els) gen_stmt(node->els); println(".L.end.%d:", c); return; } ...


如果当前处理的node节点类型为ND_IF,则
4.1gen_expr
这个函数处理if语句的条件部分,这里是处理3。判断node节点为NUM,会生成汇编语句"movrax, 3",将3载入rax寄存器。

4.2cmp_zero
cmp_zero会生成汇编语句"cmpeax, 0",比较3和0。

4.3println(" je .L.else.%d", c);
该语句会生成汇编代码" je .L.else.1",当上条比较语句中eax为0时会执行跳转,跳转到else分支运行。这里由于eax为3,所以不跳转。

4.4gen_stmt(node->then);
这条语句会将then分支中的语句解析为汇编源码,这里是"a = 4; ",这条语句是表达式语句,所以会调用gen_expr函数。

4.4.1gen_expr
"learax, a",将a的地址载入rax寄存器中。
"push rax",将rax入栈。
"movrax, 4",将4载入rax寄存器中。
"poprdi",将变量a的地址载入rdi寄存器。
"mov[rdi], eax",将4写入变量a。

4.5println(" jmp .L.end.%d", c);
执行完then分支代码后跳转到下一条语句处执行。

4.6println(".L.else.%d:", c);
插入一条标签,表示else分支代码的开始,如果if语句条件为0会跳转到这。

4.7gen_stmt(node->els);
生成else分支代码,处理"b = 5; "。
"learax, b",将变量b的地址载入rax寄存器。
"pushrax",将rax寄存器入栈。
"movrax, 5",将5载入rax寄存器。
"poprdi",将b的地址载入rdi寄存器。
"mov[rdi], eax",将5写入变量b中。

4.8println(".L.end.%d:", c);
插入一条标签,表示if语句的结束,then分支语句执行完成后跳转到这里。



【c语言if语句是如何变成汇编代码的()】

    推荐阅读