如何计算模型以及中间变量的显存占用大小
感谢博主的分享:计算模型以及中间变量的显存占用大小前言OUT OF MEMORY,显然是显存装不下你那么多的模型权重还有中间变量,然后程序奔溃了。怎么办,其实办法有很多,及时清空中间变量,优化代码,减少batch,等等等等,都能够减少显存溢出的风险。但是这篇要说的是上面这一切优化操作的基础,如何去计算我们所使用的显存。学会如何计算出来我们设计的模型以及中间变量所占显存的大小,想必知道了这一点,我们对自己显存也就会得心应手了。计算首先我们应该了解一下基本的数据量信息:1 G = 1024 MB