CH9.3/9.4|CH9.3/9.4 优化cache

如何利用cache code

  1. 把一起使用的代码放在有一块,把经常使用的代码放在一块;这里的“一起使用”是指翻译之后的,即汇编代码要在一块,通常情况下,汇编代码是和源代码差不多顺序的。
  2. 把不常用到的代码,比如异常处理放在代码(函数)的最后,或者另外使用一个函数。
  3. 对于跨文件的情况, 比如子类一个文件,父类一个文件,有时候子类的函数和父类的函数要一块执行,所以我们最好在link的时候把他们组织在一块;
    怎么组织呢,通常来讲文件link的顺序就是他们在makefile中出现的顺序。可以通过查找map file 来看每个函数在内存的什么位置。
Variable
  1. 函数中用到的变量要在函数中声明,因为函数中声明的变量(非动态分配的内存)是放在堆栈中的,我们知道堆栈中的数据是连续的,这给我们cache提供了良好的数据结构(动态分配的内存不是放在堆栈中,而是分布在内存的各个部分)。
  2. 面向对象语言可以很好的组织数据,因为一个对象里的数据肯定是连续存放的。
  3. 如果我们循环访问多个数组的相同位置,我们我们可以重新组织数据,时期访问连续。重新组织的方法有两个:合并数组和使用structa。
    例如:如下代码访问a、b数组
    int Func(int); const int size = 1024; int a[size], b[size], i; ... for(i=0; i

    上述代码访问a和b数组的对应位置。为了使访存连续,我们可以利用struct来组织数据结构,声明struct不会有额外消耗。
    int Func(int); const int size = 1024; struct Sab {int a; int b}; Sab ab[size]; int i; ... for(i=0; i

    上面代码有三个好处:(1) 数据访问时连续的; (2) 声明struct不会产生额外的开销; (3) 程序只需访问一个数组而不是两个。
    然后经过我的测试,上述代码不会并没有产生性能提升。。。。
  4. 如果我们可以根据条件选择不同的数据类型,我们可以使用union来节省一半空间。如下所示:
    void F1(int x[]); void F2(float x[]); void F3(bool y) { if (y) { int a[1000]; F1(a); } else { float b[1000]; F2(b); } }

    【CH9.3/9.4|CH9.3/9.4 优化cache】我们到a 和 b 数组只能用一个,所以用union可以更节省空间。
    void F3(bool y) { union { int a[1000]; float b[1000]; }; if (y) { F1(a); } else { F2(b); } }

    推荐阅读