C|程序员的自我修养—精华(elf文件、虚拟内存)
catalog
- 程序
程序 我们写的程序,需要经过(编译,链接)得到 最终的exe/elf(产生到 磁盘上)。
如果我们要运行他,必须要把他加载到 内存里! 因为cpu访问内存的速度 要比访问磁盘,速度快千万倍
cpu的位数,是指: 他一次性能够进行运算的 整数的宽度,因为cpu是在ALU里运算数据
所以, cpu的位数 其实是 ALU的宽度(即,数据总线的 条数)
但是, cpu的位数 不一定等于 地址总线的 条数,他等于的是 数据总线的条数
比如虚拟地址是4GB,(物理内存不一定是4GB!!),他的布局格式是:
-
[0 - 3GB]
这个地址区域,称为 用户空间
-
[0 - 128MB]
是forbidden禁止的! 他是禁止访问的,连访问都不能,更不能写!!
-
[128MB - 3GB]
,这是我们程序可以使用的 虚拟地址区域
第一个区域,他划分为有:[.text] [.data] [.bss]
我们知道,一个程序无非是:(指令) + (数据)
指令是在:.text段, 数据是在:.data段 和 .bss段
紧接着 第二个区域: heap 堆空间
第三个区域:用来放到dll共享库的!
比如,你用了很多scanf
这种函数,他在头文件里 只有声明,并没有定义。 但是,等到链接时,程序会自动的 链接一些系统的库。
第四个区域:[.stack]
段
因为,我们程序的运行 就是从入口函数开始递归,这个段就是供我们函数运行的;比如,你的局部变量 就会在这个.stack
段里。
【C|程序员的自我修养—精华(elf文件、虚拟内存)】第五个区域: 放命令行参数、环境变量。main函数的参数 argv这些
-
-
[3 - 4GB]
这个地址区域,称为 内核空间,即OS运行的空间
第一个区域是:ZONE_DMA
DMA: direct memory access
,加速 磁盘和内存 交换数据用的
在没有DMA技术前,磁盘和内存交换数据时: 磁盘数据 必须经过总线,流经 cpu的寄存器,最终才能到达内存
这是对cpu的 极大浪费。
有了DMA,比如加载一个文件 从磁盘 通过总线 到内存中时,不需要使用cpu的寄存器!!!
cpu遇到这种情况,他就会空闲下来,来调度其他的进程!!
第二区域: `ZONE_NORMAL`第三区域: `ZONE_HIGHMEM`
int a = 1;
int b = 0;
int c;
static int d = 1;
static int e = 0;
static int f;
int main(){ int g = 1;
int h = 0;
int i;
static int j = 1;
static int k = 0;
static int l;
return 0;
}
这个程序中,属于 指令的是:
int main(){ int g = 1;
int h = 0;
int i;
return 0;
}
,即他们是在 .text段。因为这些,要么是函数,要么是局部变量,可以多次调用 是属于指令。 即注意,局部变量 属于的是 指令!
而对于: 全局变量 + 局部static,这些都是 数据(即这些,在程序的运行,自始至终 都是占着内存的)
其中,已经初始化的 且不为0 的变量
a,d,j
是在 .data
段,即.data段
的大小 是12。常量(比如
"hello"
),他是在 .rodata段
没有初始的 或 初始为0的,是在
.bss
段。关于
.bss段
,有几个信息:- 在.obj文件里,
[elf header] [.text] [.data] [.bss] [.comment] [section table]
但其实你会发现,.comment段 和 .bss段
在文件里的地址,其实是一样的!!
而这两个段 大小都不是0,为什么是一样的呢?
其实,.bss
段 他在obj文件里 其实是不占空间的!!! 其实就没有这个段,.data
后面就是.comment
.bss
段 只会占的是: 虚拟空间里的内存!! 而不占.obj文件里的空间
而,这个.bss
段 在.obj文件 是不存在的,那他怎么知道 这个段里的那些全局/static变量呢?
通过读section table
段表,他里面会记录 每个段的详细信息,bss的信息 可以通过他来获取
.bss段,没必要在文件中存储。这是因为: .data段里存的 都是初始值,即程序一运行 这些值就必须初始化为(用户指定的值)
但是,.bss段里的 他的值 都是0,就不用在文件里存储他了,这样减少文件的大小
- 按理说,该有6个变量 是在.bss段。 但是,为什么
1
不是在.bss段呢?
main.c short x = 10; short y = 10; extern void func(); int main(){func(); } test.c int x; void func(){ x = 20; }
这个项目,在c++里 肯定是错误的。因为有2个x,c++里 所有的符号变量/函数
,都不能重名。
而在c里,他存在强符号(初始化了的) 和 弱符号(未初始化的)
的区别,这里:short x是强符号,int x是弱符号
(强符号:只能有1个,即初始化的 只能有1个)(弱符号:可以有多个,即未初始的 可以有多个,不管是什么类型)
(在链接后,优先使用强符号; 没有强符号,则优先使用内存最大的弱符号)
即,在项目进行链接完后,func()函数里 所使用的x,其实是:short x这个
func函数里他的汇编是: 往x 写4个字节的内存
,这是在单独编译test.c 就确定下来的汇编指令。
而最终链接后,这个汇编指令 肯定是不变的,但这个x 并不是int,而是short
所以,20的4字节是: 14 00 00 00
,前面的14 00 给short x,后面的00 00 给short y
,所以,最终:x = 20, y = 0 {x是指的short这个}
int c;
这个全局变量,他是不在.bss段的。
因为:int b = 0;
初始了,他是强符号虽然c++没有强弱符号,但这个程序 也可能是c的!!
int c;
未初始,弱符号。 他会在另外一个COM
段,不是在bss
段。因为他可能被其他obj里的强符号所顶替
其他的,都是static。static,是本文件可见!!!他是强制性的!!即,即使是一个static的弱符号,在本文件里 也不会被其他强符号替代!
static还有个名字,是local
,即本地的 本文件的。其他文件,也看不到这个文件里的static变量。
[3 - 4GB]
区域 都是共享的,因为只有1个操作系统但用户空间,他是 独立的,每个进程的 用户空间,肯定都是不同的。
当程序要运行时,即变成进程,要进行下面几个步骤:
- 从虚拟地址 到 物理内存 的 映射,创建 页目录 和 页表
- 加载 .text段 和 .data段
- 把该exe的入口地址,写到 pc寄存器里。
ELF header
里,有个entry point address
。到时候这个进程运行时,这个地址 就会放到cpu的 pc寄存器里
,即为该程序的入口地址
2:00
https://www.bilibili.com/video/BV1xf4y127AJ
==推荐阅读
- 热闹中的孤独
- JAVA(抽象类与接口的区别&重载与重写&内存泄漏)
- 放屁有这三个特征的,请注意啦!这说明你的身体毒素太多
- 一个人的旅行,三亚
- 布丽吉特,人生绝对的赢家
- 慢慢的美丽
- 尽力
- 一个小故事,我的思考。
- 家乡的那条小河
- 《真与假的困惑》???|《真与假的困惑》??? ——致良知是一种伟大的力量