C|程序员的自我修养—精华（elf文件、虚拟内存） c++|QT

catalog

程序

程序我们写的程序，需要经过（编译，链接）得到最终的exe/elf（产生到磁盘上）。
如果我们要运行他，必须要把他加载到内存里！因为cpu访问内存的速度要比访问磁盘，速度快千万倍
cpu的位数，是指：他一次性能够进行运算的整数的宽度，因为cpu是在ALU里运算数据
所以， cpu的位数其实是 ALU的宽度（即，数据总线的条数）
但是， cpu的位数不一定等于地址总线的条数，他等于的是数据总线的条数
比如虚拟地址是4GB，（物理内存不一定是4GB！！），他的布局格式是：

[0 - 3GB]这个地址区域，称为用户空间
- [0 - 128MB] 是forbidden禁止的！他是禁止访问的，连访问都不能，更不能写！！
- [128MB - 3GB]，这是我们程序可以使用的虚拟地址区域
  第一个区域，他划分为有： [.text] [.data] [.bss]
  我们知道，一个程序无非是：（指令） + （数据）
  指令是在：.text段，数据是在：.data段和 .bss段
  紧接着第二个区域： heap 堆空间
  第三个区域：用来放到dll共享库的！
  比如，你用了很多scanf这种函数，他在头文件里只有声明，并没有定义。但是，等到链接时，程序会自动的链接一些系统的库。
  第四个区域： [.stack]段
  因为，我们程序的运行就是从入口函数开始递归，这个段就是供我们函数运行的；比如，你的局部变量就会在这个.stack段里。
  【C|程序员的自我修养—精华（elf文件、虚拟内存）】第五个区域：放命令行参数、环境变量。main函数的参数 argv这些
[3 - 4GB]这个地址区域，称为内核空间，即OS运行的空间
第一个区域是： ZONE_DMA DMA： direct memory access，加速磁盘和内存交换数据用的
在没有DMA技术前，磁盘和内存交换数据时：磁盘数据必须经过总线，流经 cpu的寄存器，最终才能到达内存
这是对cpu的极大浪费。
有了DMA，比如加载一个文件从磁盘通过总线到内存中时，不需要使用cpu的寄存器！！！
cpu遇到这种情况，他就会空闲下来，来调度其他的进程！！

第二区域： `ZONE_NORMAL`第三区域： `ZONE_HIGHMEM`

int a = 1; int b = 0; int c; static int d = 1; static int e = 0; static int f; int main(){ int g = 1; int h = 0; int i; static int j = 1; static int k = 0; static int l; return 0; }

这个程序中，属于指令的是：

int main(){ int g = 1;
 int h = 0;
 int i;
 return 0;
 }

，即他们是在 .text段。
因为这些，要么是函数，要么是局部变量，可以多次调用是属于指令。即注意，局部变量属于的是指令！
而对于：全局变量 + 局部static，这些都是数据（即这些，在程序的运行，自始至终都是占着内存的）
其中，已经初始化的且不为0 的变量 a,d,j 是在 .data段，即.data段的大小是12。
常量（比如"hello"），他是在 .rodata段
没有初始的或初始为0的，是在.bss段。
关于.bss段，有几个信息：

在.obj文件里， [elf header] [.text] [.data] [.bss] [.comment] [section table]
但其实你会发现，.comment段和 .bss段 在文件里的地址，其实是一样的！！
而这两个段大小都不是0，为什么是一样的呢？
其实，.bss段他在obj文件里其实是不占空间的！！！其实就没有这个段，.data后面就是.comment
.bss段只会占的是：虚拟空间里的内存！！而不占.obj文件里的空间
而，这个.bss段在.obj文件是不存在的，那他怎么知道这个段里的那些全局/static变量呢？
通过读section table段表，他里面会记录每个段的详细信息，bss的信息可以通过他来获取
.bss段，没必要在文件中存储。这是因为： .data段里存的都是初始值，即程序一运行这些值就必须初始化为（用户指定的值）
但是，.bss段里的他的值都是0，就不用在文件里存储他了，这样减少文件的大小
按理说，该有6个变量是在.bss段。但是，为什么1不是在.bss段呢？

main.c short x = 10; short y = 10; extern void func(); int main(){func(); } test.c int x; void func(){ x = 20; }

这个项目，在c++里肯定是错误的。因为有2个x，c++里所有的符号变量/函数，都不能重名。
而在c里，他存在 强符号（初始化了的）和弱符号（未初始化的）的区别，这里：short x是强符号，int x是弱符号
（强符号：只能有1个，即初始化的只能有1个）（弱符号：可以有多个，即未初始的可以有多个，不管是什么类型）
（在链接后，优先使用强符号；没有强符号，则优先使用内存最大的弱符号）
即，在项目进行链接完后，func()函数里所使用的x，其实是：short x这个
func函数里 他的汇编是：往x 写4个字节的内存，这是在单独编译test.c 就确定下来的汇编指令。
而最终链接后，这个汇编指令肯定是不变的，但这个x 并不是int，而是short
所以，20的4字节是： 14 00 00 00，前面的14 00 给short x，后面的00 00 给short y，所以，最终：x = 20, y = 0 {x是指的short这个}
int c;这个全局变量，他是不在.bss段的。
因为： int b = 0;初始了，他是强符号 虽然c++没有强弱符号，但这个程序也可能是c的！！
int c;未初始，弱符号。他会在另外一个COM段，不是在bss段。因为他可能被其他obj里的强符号所顶替
其他的，都是static。static，是本文件可见！！！他是强制性的！！即，即使是一个static的弱符号，在本文件里也不会被其他强符号替代！
static还有个名字，是local，即本地的本文件的。其他文件，也看不到这个文件里的static变量。