优雅帽子

文章
6
资源
0
加入时间
3年0月21天

深入解析Tensor索引中的Indexing Multi-dimensional arrays问题写在前面前置知识问题描述理性分析写在最后

写在前面最近小弟做了一些实验,但是发现我写的代码虽然能够跑通,但是对于gpu的利用率始终在一个比较低的水平,这就很难受,别人的代码2h就跑完了,我得10h,经过排查发现究其原因就是代码的并行化成都不高,在代码中使用了大量的for循环,没有采用矩阵运算,就导致计算非常的慢,于是最近在学习一些大神的代码,遇到了这个在Tensor中的Indexing Multi-dimensional arrays问题。前置知识在解决这个问题之前,需要了解torch中的boardcast机制,详情可见pytorch官