操作系统开发(BIOS/MBR 编写开机引导)

不操千曲而后晓声,观千剑而后识器。这篇文章主要讲述操作系统开发:BIOS/MBR 编写开机引导相关的知识,希望能为你提供帮助。
该系列文章是在学习??《操作系统真相还原》???时通过阅读后简化并适当描述整理的学习笔记,首先,致敬作者??郑刚博士??,在读本书时能深刻的感觉到作者写书时一丝不苟的态度,书很厚写的,讲解细致幽默,很能让人愿意继续读下去,同时也不得不佩服作者计算机底层功力的深厚。
本文章只是学习笔记,并非原创作品,你可以任意转载,请保留原作者(郑刚)版权信息。


这里在实验之前需要下载 Bochs-win32-2.6.11 作者使用的是Linux版本的,在Linux写代码不太舒服,所以最好在Windows上做实验,下载好虚拟机以后还需要下载Nasm汇编器,以及GCC编译器,为了能够使用DD命令实现磁盘拷贝,这里你可以安装windows 10 下面的子系统Ubuntu,需要使用命令时可以直接切换。
Bios 软件接力第一棒
BIOS 基本输入输出系统,BIOS代码所做的工作是一成不变的,所以他是被固化到ROM中的一块只读区域中,在开机时此ROM会被映射到低端1MB内存的顶部,原因是系统在开启时默认是实地址模式(该模式最大寻址范围0-fffff),所以其寻址范围也就被限制在了??0xF0000-x0xFFFFF??区域中,这64KB的内存就是BIOS的执行代码.
在开机的一瞬间,CPU的CS:IP寄存器会被强制初始化为??0xF000:0xFFF0???,在实地址模式下该地址需要乘以16也就是左移四位加上偏移地址得到,于是??0xF000:0xFFF0???就等效于??0xFFFF0???此处的地址距离??0xFFFFF???只有16个字节的空间,里面存放着一条??jmp far f000:e05b = fe05b??的汇编指令,该指令将跳转到真正的BIOS开始的位置.
接着BIOS将会通过自身的代码对硬件进行自检测,在初始化硬件后,则开始向内存??0x000-0x3ff???中初始化数据结构以及拷贝中断向量表,紧接着BIOS将会通过调用??int 19h???中断,此中断用以检测计算机中的硬盘,如果检测到0盘0道1扇区末尾的两个字节是??0x55,0xaa???则认为此扇区确实存在,于是就会将此区域中的内容,加载到内存7c00的位置,并通过一条??jmp far 0:0x7c00h??的指令跳转到该位置执行,这样BIOS就将CPU控制权交给了MBR了,而BIOS将会再次睡去.
MBR 收到跳转来源,继续执行。
此处的7c000就是MBR代码的开始位置,之所以是7C00是因为,DOS中要求最小内存是32KB,而MBR大小必须是512字节(1KB),所以选择32kB中的最后1KB的位置最为合适,??32KB(0x8000)-1KB(0x400)=> 0x7c00???,这就是7C00的由来,同时还需要保证第510-511字节必须为??0x55,0xaa??才可以.
保存以下汇编代码,并使用 ??nasm -o mbr.bin mbr.asm??编译简易版MBR文件.

SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov fs,ax
mov sp,0x7c00

mov ax,Message
mov bp,ax; 保存字符串地址
mov cx,15; 保存字符串长度
mov ax,01301h; 子功能号13是显示字符及属性
mov bx,000ch; 页号位0,使用黑色为背景色,红色为字体颜色
mov dl,0
int 10h; 10h中断,用来显示字符
ret

Message: db "hello lyshark !"
times 510-($-$$) db 0; 填充510字节为0
db 0x55,0xaa; mbr的结束标志

【操作系统开发(BIOS/MBR 编写开机引导)】进入Bochs目录下执行??bximage.exe??生成一个映像文件,默认是a.img,你可以改名为其他的,这里我定义为linux.img

并将编译好的mbr.bin写入到镜像中
dd if=mbr.bin of=linux.img bs=512 count=1 conv=notrunc


在Bochs目录下新建并编辑bosh.src保存,然后执行??bochs.exe -f bosh.src??模拟执行MBR代码.
megs:32
romimage:file=$BXSHARE/BIOS-bochs-latest
vgaromimage:file=$BXSHARE/VGABIOS-lgpl-latest
floppya:1_44=linux.img,status=inserted
boot:floppy
log:bochsout.txt
mouse:enabled=0
keyboard: keymap=$BXSHARE/keymaps/x11-pc-de.map


上方屏幕会比较混乱,这里我们先来进行清屏操作,清屏中断调用也是int10
SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov fs,ax
mov sp,0x7c00

mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10
mov ax,Message
mov bp,ax; 保存字符串地址
mov cx,15; 保存字符串长度
mov ax,01301h; 子功能号13是显示字符及属性
mov bx,000ch; 页号位0,使用黑色为背景色,红色为字体颜色
mov dl,0
int 10h; 调用10h号中断,用来显示字符
ret

Message: db "hello lyshark !"
times 510-($-$$) db 0; 填充510字节为0
db 0x55,0xaa; mbr的结束标志

执行结果,如下,但是,打印字符串,在底部,因为光标在底部。

设置光标到顶部,这里百度一下光标中断,发现了。

接着改进代码
SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov fs,ax
mov sp,0x7c00

mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10
mov dh,0x0; 设置光标列号
mov dl,0x0; 设置光标行号
mov bh,0x0; 页码
int 0x10
mov ax,Message
mov bp,ax; 保存字符串地址
mov cx,15; 保存字符串长度
mov ax,01301h; 子功能号13是显示字符及属性
mov bx,000ch; 页号位0,使用黑色为背景色,红色为字体颜色
mov dl,0
int 10h; 调用10h号中断,用来显示字符
ret

Message: db "hello lyshark !"
times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志

完美结果。

mbr.asm
SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov fs,ax
mov sp,0x7c00

mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10
mov dh,0x0; 设置光标列号
mov dl,0x0; 设置光标行号
mov bh,0x0; 页码
int 0x10
mov ax,Message
mov bp,ax; 保存字符串地址
mov cx,15; 保存字符串长度
mov ax,01301h; 子功能号13是显示字符及属性
mov bx,000ch; 页号位0,使用黑色为背景色,红色为字体颜色
mov dl,0
int 10h; 调用10h号中断,用来显示字符
hlt
ret

Message: db "hello lyshark !"
times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志

mbr.src
megs:32
romimage:file=./BIOS-bochs-latest
vgaromimage:file=./VGABIOS-lgpl-latest
boot:disk
mouse:enabled=0
ata0-master: type=disk, path="linux.img", mode=flat, status=inserted
keyboard: keymap=./x11-pc-de.map

填充数据
dd if=mbr.bin of=linux.img bs=512 count=1 conv=notrunc
dd if=/dev/zero of=linux.img seek=1 bs=512 count=2879

运行
bochsdbg -q -f mbr.src
vb sp:0x7c00
c



让我们对显卡说点什么?
上面我们通过调用BIOS提供的??int 0x10??中断来实现打印字符操作,但我们在后期必须要借助显卡来输出图像,而显卡是外部设备,必须通过总线来操作。
由于CPU使用的信号是TTL电平,而外部设备都是机械设备,故他们不会使用该电平驱动,这就导致CPU与硬件设备没有办法实现沟通,硬件工程师们提供的方法是,在这两者之间架起一座桥,也就是在CPU和外设之间加上一层IO接口,该接口的作用就是实现CPU和外设之间相互做协调转换。
其次外部设备的种类也是多种多样的,其输出的信号可能是数字信号,也可能是模拟信号,而我们的CPU只能处理数字信号,数字信号需要经过??数模转换器< D/A> ???成模拟量才能送到外设来驱动硬件工作,模拟量也同样需要经过??模数转换器< A/D> ??转换成数字量才能被CPU直接处理,所以接口电路中需要包括A/D转换器和D/A转换器。
转换后的数字信号,会经过总线进行传递,总线的别名是BUS,之所以叫做BUS是因为其是公共线路,所有硬件设备都会走此线路,但同一时刻,CPU只能和一个IO接口(寄存器/端口)通信,当有多个IO接口同时想和CPU通信时,那么IO仲裁模块会对其进行竞争与选优,仲裁模块固化到,输入输出控制中心(ICH)也就是南桥芯片上的。
多数情况下,南桥和北桥是成对出现的,南桥主要负责连接??PCI,PCI-Express,AGP??等低速设备,而北桥则用于链接高速设备,如内存等。
IO接口都是串行口,其在设计之初就是负责与CPU进行通信的,我们想要与CPU通信,其实是向这些接口中写入数据,同时为了区别CPU中的寄存器,所以把IO接口叫做端口,某些外设可以通过内存映射来访问,即把某些端口映射到指定内存中,访问某个内存区域就相当于访问了指定的端口。
SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov sp,0x7c00
mov ax,0xb800
mov gs,ax

mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10

mov dh,0x0; 设置光标列号
mov dl,0x0; 设置光标行号
mov bh,0x0; 页码
int 0x10

mov byte [gs:0x00],M
mov byte [gs:0x01],0xa4 ; 显示A=绿色闪烁 4=红色

mov byte [gs:0x02],B
mov byte [gs:0x03],0xa5

mov byte [gs:0x04],R
mov byte [gs:0x05],0xa6
ret

times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志

BOchs调试命令常用的有以下几种.
vbreak 0x0000:0x7c0007c000设置断点
pb 0x7c000设置物理断点
vb sp:0x7c00设置虚拟断点(保护模式)
info break显示所有断点状态
delete num删除一个断点

c运行遇到断点停下
n执行下一指令
r显示寄存器
u/10向下反汇编10条
print-stack打印堆栈

x /nuf addr 查看一个线性地址的内存
xp /nuf addr 查看一个物理地址的内存
n 显示多少个字节的内存
u 单位长度; one o单位f
b 字节
h 半字(2 字节)
w 字 (4 字节)
g 双字 (8 字节)

F 打印格式:
x 打印十六进制
d 打印十进制
u 打印无符号十进制
o 打印八进制
t 打印二进制


SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
mov ax,cs
mov sp,0x7c00
mov ax,0xb800
mov gs,ax

mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10

mov dh,0x0; 设置光标列号
mov dl,0x0; 设置光标行号
mov bh,0x0; 页码
int 0x10

mov byte [gs:0x00],L
mov byte [gs:0x01],0xa4 ; 显示A=绿色闪烁 4=红色

mov byte [gs:0x02],y
mov byte [gs:0x03],0xa5

mov byte [gs:0x04],S
mov byte [gs:0x05],0xa6

mov byte [gs:0x6],h
mov byte [gs:0x7],0xa7

mov byte[gs:0x8],a
mov byte [gs:0x9],0xa6

mov byte[gs:0xa],r
mov byte [gs:0xb],0xa5

mov byte[gs:0xc],k
mov byte [gs:0xd],0xa4
hlt
ret

times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志

循环显存
_start:
; 清屏和设置光标位置
mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10

mov dh,0x0; 设置光标列号
mov dl,0x0; 设置光标行号
mov bh,0x0; 页码
int 0x10

; 初始化数据段,使其指向段基址0X7C0处,即Boot代码被加载的地方
movax, 0x07c0; 设置加载基址
movds, ax

; 将文本显示内存段基址 放在ES中,供后面显示字符使用
movax, 0xb800; 设置显存地址
moves, ax

movcx, msglen; 获取字符串长度
movsi, message; 设置字符串基址
xordi, di

loop_str:
mov al, [si]; 每次取出一个字符
mov [es:di], al; 将字符逐一赋值到显存中
inc si
inc di

mov byte [es:di], 0x07; 设置字体颜色
inc di
loop loop_str


hlt; 程序在此处终止

messagedb "Loading MBR..."
msglendb $ - message

times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志

Bochs 调试命令
CPU加电后,会跳转到 0xffff0 处,我们可以反汇编这段内存地址,向下反汇编10条。

分别显示,CPU模式,中断,call调用源。

设置vb虚拟地址断点,pb设置物理地址断点。blist显示所有断点。

bpd禁用断点,bpe启用断点。del删除断点。

info idt = 显示中断向量表 , gdt 全局描述符表,ldt 局部描述符表,tss 任务状态段,ivt 中断向量表
SECTION MBR vstart=0x7c00; 告诉编译器加载到7c00内存处
; 清屏和设置光标位置
mov ax,0x600; 清屏范围,也就是宽度
mov bx,0x0
mov cx,0x0; 清屏 左上角(0,0)
mov dx,0x184f; 清屏 右下角(80=0x4f,25=0x18)
int 0x10

mov dh,0x0; 设置光标列号 左上角(0,0)
mov dl,0x0; 设置光标行号 右下角(0,0)
mov bh,0x0; 页码
int 0x10

; 初始化,使SP寄存器指向段基址0X7C0处,GS指向显存基地址
mov ax,cs
mov sp,0x7c00
mov ax,0xb800
mov gs,ax; 设置显存地址

; 设置字符串长度与字符串基地址
mov cx, msglen; 获取字符串长度
mov si, message; 设置字符串基址
xor di, di; 每次清空di寄存器

loop_str:
mov al, [si]; 每次取出一个字符
mov [gs:di], al; 将字符逐一赋值到显存中
inc si
inc di

mov byte [gs:di], 000ch ; 设置字体颜色
inc di
loop loop_str

hlt; 程序在此处终止

; message db "Hello LyShark...",0ah,0dh
message db "Hello LyShark..."
msglenequ $ - message

times 510-($-$$) db 0; 填充剩余的510字节的空间为0
db 0x55,0xaa; mbr的结束标志


版权声明:本博客文章与代码均为学习时整理的笔记,文章 [均为原创] 作品,转载请 [添加出处] ,您添加出处是我创作的动力!




    推荐阅读