手把手建立Roofline模型（CPU）手把手建立Roofline模型（CPU）

Roofline模型原理 Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度（Operational Intensity）下能够达到的理论计算上限。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析。本文旨在教授如何根据当前开发环境机器建立该模型，并简单的介绍如何根据算法计算OI(计算强度)。
需要准备的硬件参数对于CPU而言，我们需要一下参数：

	频率	内存带宽(double)	Avx512 Unit	Fma
Intel? Xeon? Gold 6148	2.7GHz	39.74GB/s	2	2

其中Avx512、Fma并非是必备参数。

【手把手建立Roofline模型（CPU）】查询CPU相关指标方法或网站:

在LINUX 下可以使用lscpu 查询.

计算相关参数：
当前CPU的理论峰值：
?\(理论性能峰值 ={频率*512*AVX数量*FMA \over 32/64}\)

AVX和FMA并不是必要参数，32/64取决于当前处理问题是单精度（32）或者双精度（64）

由上述公式，我们可以计算出Xeon Gold 6148的计算双精度理论性能峰值为2.7GHz*2(avx)*2(FMA)/64=86.4Gfplos。
计算当前内存带宽：
通常情况下我们可以通过 wikichip 搜索到，当然也可以通过 StreamBenchmark 程序获取。
建立Roofline模型

文章图片

Roofline模型中的相关参数公式如下，并计算Xeon Gold 6148 的参数：

\(\pi=理论性能峰值\) ，根据上文内容，我们已经计算出当前CPU的理论性能峰值就是86.4Gflops。
\(\beta=理论内存带宽\) ，上一章节有关于理论内存带宽获取方式，当前CPU的值为39.74Gflops。
\(I_{max} = {\pi \over \beta}\) ，显然易得当前值为2.17。

根据当前算法计算OI 访存密集型算法

void saxpy(double *a,double * b,double* c,int n,int s) { for(int i=0; i



 
 分析程序的AI

 
 该程序循环内做了一次乘法和一次加法，读取了三个数据，已知操作的数据都为64位浮点数，那么 \(OI={2*N \over 8*3*N}={1 \over 12}\)。根据公式 \(FLOPS=OI \times BW(bound witdh)\) 可得当前的算法的理论峰值为~3.3Gflops。实际测试结果为2.4Gflops，存在可能优化的空间。

 
 运算密集型算法 
 最简单的运算密集型程序为矩阵乘法 。这里就不具体算法实现展示。直接分析程序的OI，假设矩阵的的大小为 \(M\) ，矩阵乘需要加载两次矩阵，并写入一次矩阵，那么总的数据加载读取量为 \(3 \times M \times M\) ，矩阵乘的每个元素需要需要进行 \(M\) 次乘操作和 \(M-1\) 次加操作，因此，计算总量为 \(2*(M-1) \times M^2\) ，当不考虑数据是64位浮点时，可得 \(OI={2*(M-1) \over 3*8}\) 。当矩阵大小大于40时，对于当前CPU输入计算密集型程序，可达到的理论峰值为86.4Gflops。

 
 优化方式 
 论文 给出了一些可以优化的方式：

 
  
针对访存密集型程序，可以通过soft perfetch等技术优化。 
针对计算密集型程序，可以通过SIMD等技术优化。 
  
  

文章图片 




		  	

    
    




    
    
    


推荐阅读

           
                  
              
                  洛阳牡丹怎么养，洛阳牡丹花如何养 
                
                   
                
              
            

                  
              
                  虎头茉莉怎么施肥 虎头茉莉怎么养 
                
                   
                
              
            

                  
              
                  战歌竞技场亡灵战阵容怎么组 战歌竞技场亡灵战阵容分享 
                
                   
                
              
            

                  
              
                  小学毕业寄语50句话 小学毕业寄语50句 
                
                   
                
              
            

                  
              
                  脂肪型肥胖的危害有哪些 引起肥胖的三类脂肪 
                
                   
                
              
            

                  
              
                  光火神殿为什么在秩序之战闭门不出？ 
                
                   
                
              
            

                  
              
                  我最近经常吃辣条，会口臭，是辣条造成的吗？ 
                
                   
                
              
            

                  
              
                  胡忠信名字打分102分 
                
                   
                
              
            

                  
              
                  翠玉是玉还是翡翠 翠玉属于翡翠吗 
                
                   
                
              
            

                  
              
                  精油皂和洗面奶哪个洗脸好 
                
                   
                
              
            

                  
              
                  吃菠萝蜜会发胖吗 
                
                   
                
              
            

                  
              
                  gmc是什么车gmc是哪个公司的车 
                
                   
                
              
            

                  
              
                  淘宝不认tm商标 淘宝如何申请商标入驻，入驻淘宝品牌库显示近似商标 
                
                   
                
              
            

                  
              
                  空调外机没有水滴下来怎么回事 美的空调制冷室外机不滴水怎么回事 
                
                   
                
              
            

                  
              
                  抖音极速版怎么合拍不了 抖音极速版怎么合拍 
                
                   
                
              
            

                  
              
                  信息流推荐系统智能交付解决方案探索 
                
                   
                
              
            

                  
              
                  佳能废墨垫清零教程视频下载安装 
                
                   
                
              
            

                  
              
                  到山西做客，主家很少用青花汾招待，这4款好酒才是宴请的首选 
                
                   
                
              
            

                  
              
                  欧洲的牧场和食品库之称的国家是 
                
                   
                
              
            

                  
              
                  520和521代表什么意思 520和521区别是什么 
                
                   
                
              
            

          

Esp32笔记，关于 Linux编译环境的建立Fail 
 手把手教你写一个SpringMVC框架 
 《手把手教你》系列基础篇（七十七）-java+|《手把手教你》系列基础篇（七十七）-java+ selenium自动化测试-框架设计基础-TestNG依赖测试- 上篇（详解教程） 
 还不会用springboot写接口（快看这里，手把手操作，一发入魂~） 
 Vite 实战（手把手教你写一个 Vite 插件） 
 C/C++气象数据中心实战，手把手教你做工业级项目 
 《手把手教你》系列基础篇（七十六）-java+|《手把手教你》系列基础篇（七十六）-java+ selenium自动化测试-框架设计基础-TestNG实现DDT - 下篇（详解教程） 
 笔记|RL强化学习笔记（OpenAI gym建立自己的探索环境） 
 《手把手教你》系列基础篇（七十五）-java+|《手把手教你》系列基础篇（七十五）-java+ selenium自动化测试-框架设计基础-TestNG实现DDT - 中篇（详解教程） 
 计算机视觉|YoloV5建立自己的数据集并进行训练