Hiding computation in a subroutine
Hiding computation in a subroutine
- 我们首先重写基本实现,将内部循环隐藏在子程序AddDot中:
- Optimization1 · flame/how-to-optimize-gemm Wiki (github.com)
- Optimization2 · flame/how-to-optimize-gemm Wiki (github.com)
这一步不会产生任何性能提升:
它其实是为我们下一步做好准备。
Optimization1
这里最原始的矩阵乘代码:
1 |
|
拆分内部循环,把乘加运算放在子程序AddDot中:
1 |
|
Optimization2
1 |
|
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!