2023年09月归档_霸气鸵鸟的博客_JavaScript,处理器CPU,笔记,pytorch,运维,多Agent系统,Linux领域博主

霸气鸵鸟

文章

资源

加入时间

4年6月2天

.zero_grad()的重要性

根据pytorch中的backward()函数的计算，当网络参量进行反馈时，梯度是被积累的而不是被替换掉；但是在每一个batch时毫无疑问并不需要将两个batch的梯度混合起来累积，因此这里就需要每个batch设置一遍zero_grad。如果不是每一个batch就清除掉原有的梯度，而是比如说两个batch再清除掉梯度，这是一种变相提高batch_size的方法，对于计算机硬件不行，但是batch_size可能需要设高的领域比较适合，比如目标检测模型的训练。不写.zero_grad()的代码结果。

pytorch 2023-09-06 268 点赞 4 评论 406 浏览

他的专栏

JavaScript（0）

处理器CPU（0）

笔记（1）

pytorch（1）

运维（1）

多Agent系统（1）

Linux（1）

他的归档

2023年09月（1）

热门文章

python 中删除非空的文件夹

.zero_grad()的重要性

快速配置ssh互信下载sshpass创建公钥和密钥本机localhost无密码登录修改/etc/hosts文件，写入所有节点名和ip使用sshpass复制到其它节点上

第一次运行JADE平台

Linux xargs从标准输入构建和执行命令行xargs 一般是和管道一起使用退出状态实例