在CUDA C/C++中如何衡量代码性能

转载自
https://segmentfault.com/a/1190000007540468
【在CUDA C/C++中如何衡量代码性能】主要讲三方面:
1. 时间
2. 带宽
3. GFLOPS

    推荐阅读