操作系统实验报告 lab1 操作系统实验

练习1 1.1 操作系统镜像文件 ucore.img 是如何一步一步生成的?(需要比较详细地解释 Makefile 中每一条相关命令和命令参数的含义,以及说明命令导致的结果)
利用make V= 查看执行了那些命令
生成ucore.img的代码如下

$(UCOREIMG): $(kernel) $(bootblock) $(V)dd if=/dev/zero of=$@ count=10000 $(V)dd if=$(bootblock) of=$@ conv=notrunc $(V)dd if=$(kernel) of=$@ seek=1 conv=notrunc $(call create_target,ucore.img)

输出如下图

文章图片

指令：
dd：用指定大小的块拷贝一个文件，并在拷贝的同时进行指定的转换。
if=文件名：输入文件名，缺省为标准输入。即指定源文件。< if=input file >
of=文件名：输出文件名，缺省为标准输出。即指定目的文件。< of=output file >
count=blocks：仅拷贝blocks个块，块大小等于ibs指定的字节数。
conv=conversion：用指定的参数转换文件。
conv=notrunc:不截短输出文件

由上描述可以看出，首先先创建一个大小为10000字节的块，然后再将bootblock，kernel拷贝过去。然而生成ucore.img需要先生成kernel和bootblock
1.生成bootblock的相关代码如下

$(bootblock): $(call toobj,$(bootfiles)) | $(call totarget,sign) @echo "========================$(call toobj,$(bootfiles))" @echo + ld $@ $(V)$(LD) $(LDFLAGS) -N -e start -Ttext 0x7C00 $^ -o $(call toobj,bootblock) @$(OBJDUMP) -S $(call objfile,bootblock) > $(call asmfile,bootblock) @$(OBJCOPY) -S -O binary $(call objfile,bootblock) $(call outfile,bootblock) @$(call totarget,sign) $(call outfile,bootblock) $(bootblock)

由上代码可得，到要生成bootblock，首先需要生成bootasm.o、bootmain.o、sign
下图是在编译时生成的中间文件

文章图片

生成bootasm.o、bootmain.o、sign的相关代码为：

文章图片

其中相关参数的含义为：
ggdb 生成可供gdb使用的调试信息
-m32生成适用于32位环境的代码
-gstabs 生成stabs格式的调试信息
-nostdinc 不使用标准库
-fno-stack-protector 不生成用于检测缓冲区溢出的代码
-0s 位减小代码长度进行优化

拷贝二进制代码bootblock.o到bootblock.out
objcopy -S -O binary obj/bootblock.o obj/bootblock.out
其中关键的参数为
-S 移除所有符号和重定位信息
-O 指定输出格式
使用sign工具处理bootblock.out，生成bootblock
bin/sign obj/bootblock.out bin/bootblock

kernel = $(call totarget,kernel)$(kernel): tools/kernel.ld$(kernel): $(KOBJS) @echo + ld $@ $(V)$(LD) $(LDFLAGS) -T tools/kernel.ld -o $@ $(KOBJS) @$(OBJDUMP) -S $@ > $(call asmfile,kernel) @$(OBJDUMP) -t $@ | $(SED) '1,/SYMBOL TABLE/d; s/ .* / /; /^$$/d' > $(call symfile,kernel)$(call create_target,kernel)

查看命令，生成kernel需要以下文件：

ld -melf_i386 -nostdlib -T tools/kernel.ld -o bin/kernelobj/kern/init/init.o obj/kern/libs/readline.o obj/kern/libs/stdio.o obj/kern/debug/kdebug.o obj/kern/debug/kmonitor.o obj/kern/debug/panic.o obj/kern/driver/clock.o obj/kern/driver/console.o obj/kern/driver/intr.o obj/kern/driver/picirq.o obj/kern/trap/trap.o obj/kern/trap/trapentry.o obj/kern/trap/vectors.o obj/kern/mm/pmm.oobj/libs/printfmt.o obj/libs/string.o

1.2 一个被系统认为是符合规范的硬盘主引导扇区的特征是什么？
查看sign.c源代码

buf[510] = 0x55; buf[511] = 0xAA; FILE *ofp = fopen(argv[2], "wb+"); size = fwrite(buf, 1, 512, ofp); if (size != 512) { fprintf(stderr, "write '%s' error, size is %d.\n", argv[2], size); return -1; }

从上述代码可以看出，要求硬盘主引导扇区的大小是512字节，还需要第510个字节是0x55,第511个字节为0xAA,也就是说扇区的最后两个字节内容是0x55AA
练习2

题目要求：
从 CPU加电后执行的第一条指令开始，单步跟踪 BIOS的执行。
在初始化位置 0x7c00 设置实地址断点,测试断点正常。
从 0x7c00 开始跟踪代码运行,将单步跟踪反汇编得到的代码与 bootasm.S和 bootblock.asm进行比较。
自己找一个 bootloader或内核中的代码位置，设置断点并进行测试

2.1从 CPU加电后执行的第一条指令开始，单步跟踪 BIOS的执行。
1 修改 lab1/tools/gdbinit,内容为:

set architecture i8086 target remote :1234

2.在 lab1目录下，执行make debug
执行命令如下图

文章图片

3.设置单步调试si
4.在gdb界面下，可通过如下命令来看BIOS的代码

x /2i $pc//显示当前eip处的汇编指令

文章图片

【操作系统实验报告 lab1】### 2.2 在初始化位置0x7c00设置实地址断点,测试断点正常
在tools/gdbinit结尾加上

set architecture i8086//设置当前调试的CPU是8086 b *0x7c00//在0x7c00处设置断点。此地址是bootloader入口点地址，可看boot/bootasm.S的start地址处 c//continue简称，表示继续执行 x /2i $pc//显示当前eip处的汇编指令 set architecture i386//设置当前调试的CPU是80386

文章图片

所以断点正常
2.3 从0x7c00开始跟踪代码运行,将单步跟踪反汇编得到的代码与bootasm.S和 bootblock.asm进行比较
在tools/gdbinit结尾加上

b *0x7c00 c x /10i $pc

在0x7c00处break，然后使用si和 x/i $pc 指令一行一行的跟踪，将得到的反汇编代码为：

0x00007c01 in ?? () (gdb) x/i $pc => 0x7c01:cld (gdb) si 0x00007c02 in ?? () (gdb) x/i $pc => 0x7c02:xor%eax,%eax (gdb) si 0x00007c04 in ?? () (gdb) x/i $pc => 0x7c04:mov%eax,%ds (gdb)

bootblock.S 中的代码为：

.code16# Assemble for 16-bit mode cli# Disable interrupts cld# String operations increment# Set up the important data segment registers (DS, ES, SS). xorw %ax, %ax# Segment number zero movw %ax, %ds# -> Data Segment movw %ax, %es# -> Extra Segment movw %ax, %ss# -> Stack Segment# Enable A20: #For backwards compatibility with the earliest PCs, physical #address line 20 is tied low, so that addresses higher than #1MB wrap around to zero by default. This code undoes this.

bootblock.asm

start: .code16# Assemble for 16-bit mode cli# Disable interrupts 7c00:facli cld# String operations increment 7c01:fccld# Set up the important data segment registers (DS, ES, SS). xorw %ax, %ax# Segment number zero 7c02:31 c0xor%eax,%eax movw %ax, %ds# -> Data Segment 7c04:8e d8mov%eax,%ds movw %ax, %es# -> Extra Segment 7c06:8e c0mov%eax,%es movw %ax, %ss# -> Stack Segment 7c08:8e d0mov%eax,%ss

观察发现他们相同
练习3

题目：
分析bootloader 进入保护模式的过程。
BIOS 将通过读取硬盘主引导扇区到内存，并转跳到对应内存中的位置执行 bootloader。请分析bootloader是如何完成从实模式进入保护模式的

从bootasm.s查看代码(在这里分析bootblock.asm也可以，二者源码相同)，并分析过程
宏定义

.set PROT_MODE_CSEG,0x8#内核代码段选择子 .set PROT_MODE_DSEG,0x10#内核数据段选择子 .set CR0_PE_ON,0x1#保护模式使能标志

1.关闭中断，将各个段寄存器重置
修改控制方向标志寄存器DF=0，使得内存地址从低到高增加
它先将各个寄存器置0

#CPU刚启动为16位模式 cli# 关中断 cld# 清方向标志 xorw %ax, %ax# 置零 movw %ax, %ds# -> 数据段寄存器 movw %ax, %es# -> 附加段寄存器 movw %ax, %ss# -> 堆栈段寄存器

2 .开启A20
开启A20地址线之后，用来表示内存地址的位数变多了。开启前20位，开启后是32位。如果不开启A20地址线内存寻址最大只能找到1M，对于1M以上的地址访问会变成对address mod 1M地址的访问。通过将键盘控制器上的A20线置于高电位，全部32条地址线可用，可以访问4G的内存空间。
打开A20地址线为了兼容早期的PC机，第20根地址线在实模式下不能使用所以超过1MB的地址，默认就会返回到地址0，重新从0循环计数，下面的代码打开A20地址线。

seta20.1: inb $0x64, %al# 从0x64端口读入一个字节的数据到al中 testb $0x2, %al# test指令可以当作and指令，只不过它不会影响操作数 jnz seta20.1#如果上面的测试中发现al的第2位为0，就不执行该指令否则就循环检查movb $0xd1, %al# 将0xd1写入到al中 outb%al,$0x64#将al中的数据写入到端口0x64中seta20.2: inb $0x64, %al testb $0x2, %al jnz seta20.2movb $0xdf, %al# 通过0x60写入数据11011111 即将A20置1 outb %al, $0x60

初始化GDT表：一个简单的GDT表和其描述符已经静态储存在引导区中，载入即可

lgdt gdtdesc #将全局描述符表描述符加载到全局描述符表寄存器

进入保护模式：通过将cr0寄存器PE位置1便开启了保护模式

cr0中的第0位为1表示处于保护模式 cr0中的第0位为0，表示处于实模式把控制寄存器cr0加载到eax中movl %cr0, %eax orl $CR0_PE_ON, %eax movl %eax, %cr0

通过长跳转更新cs的基地址

ljmp $PROT_MODE_CSEG, $protcseg .code32 protcseg:

设置段寄存器，并建立堆栈

movw $PROT_MODE_DSEG, %ax movw %ax, %ds movw %ax, %es movw %ax, %fs movw %ax, %gs movw %ax, %ss movl $0x0, %ebp movl $start, %esp

转到保护模式完成，进入boot主方法

call bootmain

练习4

题目：
分析bootloader加载ELF格式的OS的过程
1. bootloader如何读取硬盘扇区的？
2. bootloader是如何加载 ELF格式的 OS？

bootmain 代码

bootmain(void) { readseg((uintptr_t)ELFHDR, SECTSIZE * 8, 0); if (ELFHDR->e_magic != ELF_MAGIC) { goto bad; } struct proghdr *ph, *eph; ph = (struct proghdr *)((uintptr_t)ELFHDR + ELFHDR->e_phoff); eph = ph + ELFHDR->e_phnum; for (; ph < eph; ph ++) { readseg(ph->p_va & 0xFFFFFF, ph->p_memsz, ph->p_offset); } ((void (*)(void))(ELFHDR->e_entry & 0xFFFFFF))(); bad: outw(0x8A00, 0x8A00); outw(0x8A00, 0x8E00); while (1); }

readsect从设备的第secno扇区读取数据到dst位置

static void readsect(void *dst, uint32_t secno) { waitdisk(); outb(0x1F2, 1); // 设置读取扇区的数目为1 outb(0x1F3, secno & 0xFF); outb(0x1F4, (secno >> 8) & 0xFF); outb(0x1F5, (secno >> 16) & 0xFF); outb(0x1F6, ((secno >> 24) & 0xF) | 0xE0); // 上面四条指令联合制定了扇区号 // 在这4个字节线联合构成的32位参数中 //29-31位强制设为1 //28位(=0)表示访问"Disk 0" //0-27位是28位的偏移量 outb(0x1F7, 0x20); // 0x20命令，读取扇区waitdisk(); insl(0x1F0, dst, SECTSIZE / 4); // 读取到dst位置， // 幻数4因为这里以DW为单位 }

IO地址功能
0x1f0 读数据，当0x1f7不为忙状态时，可以读。
0x1f2 要读写的扇区数，每次读写前，你需要表明你要读写几个扇区。最小是1个扇区
0x1f3 如果是LBA模式，就是LBA参数的0-7位
0x1f4 如果是LBA模式，就是LBA参数的8-15位
0x1f5 如果是LBA模式，就是LBA参数的16-23位
0x1f6 第0~3位：如果是LBA模式就是24-27位第4位：为0主盘；为1从盘
0x1f7 状态和命令寄存器。操作时先给命令，再读取，如果不是忙状态就从0x1f0端口读数据

加载ELF文件

bootmain(void) { ..........if (ELFHDR->e_magic != ELF_MAGIC) {//这里有个判断 goto bad; } struct proghdr *ph, *eph; //ELF头部有描述ELF文件应加载到内存什么位置的描述表，这里读取出来将之存入ph ph = (struct proghdr *)((uintptr_t)ELFHDR + ELFHDR->e_phoff); eph = ph + ELFHDR->e_phnum; //按照程序头表的描述，将ELF文件中的数据载入内存 for (; ph < eph; ph ++) { readseg(ph->p_va & 0xFFFFFF, ph->p_memsz, ph->p_offset); ((void (*)(void))(ELFHDR->e_entry & 0xFFFFFF))(); //根据ELF头表中的入口信息，找到内核的入口并开始运行 bad: .......... }

练习5

题目：
实现函数调用堆栈跟踪函数

什么是函数栈？
当函数被调用时，首先会把函数的参数依次入栈（这里指的是堆栈传参，当然也可以用寄存器传参）调用函数的栈底压栈到自己函数的栈中（push bp），然后将原来函数栈顶sp作为当前函数的栈底（mov bp,sp）。函数运行完成时，会将压入栈中的bp重新出栈到bp中（pop bp）。同时将计算的结果保存在寄存器中，返回原界面。
那么我们可以粗浅的建立一个栈模型

ss:[ebp-8]; 变量2 ss:[ebp-4]; 变量1 ss:[ebp]; 栈针 ss:[ebp+4]; 返回地址 ss:[ebp+8]; 第一个参数

函数实现
read_ebp()和read_eip()函数来获取当前ebp寄存器和eip 寄存器的信息。
查看print_stackframe函数注释

/* LAB1 YOUR CODE : STEP 1 */ /* (1) call read_ebp() to get the value of ebp. the type is (uint32_t); * (2) call read_eip() to get the value of eip. the type is (uint32_t); * (3) from 0 .. STACKFRAME_DEPTH *(3.1) printf value of ebp, eip *(3.2) (uint32_t)calling arguments [0..4] = the contents in address (unit32_t)ebp +2 [0..4] *(3.3) cprintf("\n"); *(3.4) call print_debuginfo(eip-1) to print the C calling function name and line number, etc. *(3.5) popup a calling stackframe *NOTICE: the calling funciton's return addr eip= ss:[ebp+4] *the calling funciton's ebp = ss:[ebp] */

for(i = 0; ebp!=0 && i < STACKFRAME_DEPTH; i++) {//STACKFRAME_DEPTH = 20 一直向上循环找到所有的调用函数为止，一开始没有判断栈针为空的条件 cprintf("ebp:0x%08x eip:0x%08x ",ebp, eip); uint32_t *args = (uint32_t *)ebp + 2; //传参 for(j = 0; j < 4; j++) cprintf("0x%08x ",args[j]); cprintf("\n"); print_debuginfo(eip-1); //模拟函数执行完毕 eip = *((uint32_t *)ebp+1); //调用函数的返回地址 ebp = *((uint32_t *)ebp); //上一个函数的栈针 //循环直到没有调用函数停止 }

执行结果如下：
未加ebp!=0

文章图片

我们发现ebp的值在0x7bf8之后就为零了，这说明上面没有了调用函数，直接加个判断
ebp!=0 就可以输出预期的结果。
加了ebp!=0
练习6

题目：
1.中断向量表中一个表项占多少字节？其中哪几位代表中断处理代码的入口？
2.请编程完善kern/trap/trap.c中对中断向量表进行初始化的函数idt_init。在idt_init函数中，依次对所有中断入口进行初始化。使用mmu.h中的SETGATE宏，填充idt数组内容。注意除了系统调用中断(T_SYSCALL)以外，其它中断均使用中断门描述符，权限为内核态权限；而系统调用中断使用异常,权限为陷阱门描述符。每个中断的入口由tools/vectors.c生成，使用trap.c中声明的vectors数组即可。
3.请编程完善trap.c中的中断处理函数trap在对时钟中断进行处理的部分填写trap函数中处理时钟中断的部分，使操作系统每遇到100次时钟中断后，调用 print_ticks子程序，向屏幕上打印一行文字100 ticks。

1.中断向量表中一个表项占多少字节？其中哪几位代表中断处理代码的入口？
中断向量表一个表项占用8字节，其中2-3字节是段选择子，0-1字节和6-7字节拼成位移，
两者联合便是中断处理程序的入口地址。
中断描述符表中一个表项占8个字节，其中每个位的作用如图：

文章图片

其中015和4863分别为offset的低16位和高16位，16~31位是段选择子，通过段选择子得到段基址，再加上段内偏移量就可以得到中断处理代码的入口。

2.请编程完善kern/trap/trap.c中对中断向量表进行初始化的函数idt_init

extern uintptr_t __vectors[]; //声明__vertors[] You can use"extern uintptr_t __vectors[]; " to define this extern variable which will be used later. int i; for(i=0; i<256; i++) { SETGATE(idt[i],0,GD_KTEXT,__vectors[i],DPL_KERNEL); //对整个idt数组进行初始化 } SETGATE(idt[T_SWITCH_TOK],0,GD_KTEXT,__vectors[T_SWITCH_TOK],DPL_USER); //在这里先把所有的中断都初始化为内核级的中断 lidt(&idt_pd); //使用lidt指令加载中断描述符表 just google it! and check the libs/x86.h to know more.利用google找到了相关函数 } /*传入的第一个参数gate是中断的描述符表传入的第二个参数istrap用来判断是中断还是trap 传入的第三个参数sel的作用是进行段的选择传入的第四个参数off表示偏移传入的第五个参数dpl表示这个中断的优先级*/

3.程完善trap.c中的中断处理函数trap在对时钟中断进行处理的部分填写trap函数中处理时钟中断的部分，使操作系统每遇到100次时钟中断后，调用 print_ticks子程序，向屏幕上打印一行文字100 ticks
实验代码填写

case IRQ_OFFSET + IRQ_TIMER: /* LAB1 YOUR CODE : STEP 3 */ /* handle the timer interrupt */ /* (1) After a timer interrupt, you should record this event using a global variable (increase it), such as ticks in kern/driver/clock.c * (2) Every TICK_NUM cycle, you can print some info using a funciton, such as print_ticks(). * (3) Too Simple? Yes, I think so! */

代码如下：