梯度裁剪Grandient Clipping梯度裁剪有两种方法梯度裁剪使用位置

74 阅读 0 评论 49 点赞

我是靠谱客的博主温柔向日葵，这篇文章主要介绍梯度裁剪Grandient Clipping梯度裁剪有两种方法梯度裁剪使用位置，现在分享给大家，希望可以做个参考。

神经网络是通过梯度下降来学习的。

梯度爆炸问题一般会随着网络层数的增加而变得越来越明显。如果发生梯度爆炸，那么就是学过了，会直接跳过最优解。因此需要梯度裁剪，避免模型越过最优点。

梯度裁剪有两种方法

确定一个范围，参数的gradient超过，直接裁剪。比较直接，对应于pytorch中的nn.utils.clip_grad_value(parameters, clip_value). 将所有的参数剪裁到 [ -clip_value, clip_value]
根据若干参数的gradient组成的vector的L2 Norm进行裁剪。更常见，对应于pytorch中clip_grad_norm_(parameters, max_norm, norm_type=2)。如果所有参数的gradient组成的向量的L2 norm 大于max norm，那么需要根据L2 norm/max_norm 进行缩放。从而使得L2 norm 小于预设的 clip_norm

梯度裁剪使用位置

在backward得到梯度之后，step()更新之前，使用梯度剪裁，在完成计算完梯度后，进行裁剪，然后进行网络更新的过程。

最后

以上就是温柔向日葵最近收集整理的关于梯度裁剪Grandient Clipping梯度裁剪有两种方法梯度裁剪使用位置的全部内容，更多相关梯度裁剪Grandient内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(49)

本文分类：python
浏览次数：74 次浏览
发布日期：2023-09-10 09:10:10
本文链接：https://www.kaopuke.com/article/k-p-k_14_uzo_6_fy_14__7__14_0.html

相关文章

梯度消失，梯度爆炸产生的原因及解决办法

梯度消失，梯度爆炸产生的原因及解决办法

RNN的通俗讲解（初级篇）

深度学习建模训练总结（八）：如何处理梯度消失（爆炸）

深度学习建模训练总结（八）：如何处理梯度消失（爆炸）

TensorFlow(十一)：递归神经网络（RNN与LSTM）

TensorFlow(十一)：递归神经网络（RNN与LSTM）

梯度裁剪Grandient Clipping梯度裁剪有两种方法梯度裁剪使用位置

梯度裁剪Grandient Clipping梯度裁剪有两种方法梯度裁剪使用位置

解决梯度消失的方法

【深度学习基础知识 - 03】梯度消失和梯度爆炸的概念及解决方案概念梯度消失和梯度爆炸的解决方案

【深度学习基础知识 - 03】梯度消失和梯度爆炸的概念及解决方案概念梯度消失和梯度爆炸的解决方案

RNN梯度消失和爆炸的原因以及 LSTM如何解决梯度消失问题RNN梯度消失和爆炸的原因LSTM如何解决梯度消失问题

RNN梯度消失和爆炸的原因以及 LSTM如何解决梯度消失问题RNN梯度消失和爆炸的原因LSTM如何解决梯度消失问题

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部