我是靠谱客的博主 糊涂蜻蜓,最近开发中收集的这篇文章主要介绍Pytorch优化器的权重衰减(weight_decay),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

L2正则化:

L = E e + λ ∑ w i 2 L=E_e + lambdasum w_i^2 L=Ee+λwi2
E e E_e Ee:是训练数据个标签之间的误差
w i w_i wi:表示权重值

在反向传播计算梯度时,对每个权重点来说,就是在原本计算的 E e E_e Ee梯度上,再加上 2 ∗ λ ∗ w i 2*lambda*w_i 2λwi, 2和 λ lambda λ可一起看做常数项系数.

Pytorch里实现的权重衰减:

再看看Pytorch里实现的权重衰减方式:
从源代码来看.pytorch中对self.weight和self.bias参数都进行了L2正则化,weight_decay是衰减系数.
在这里插入图片描述

最后

以上就是糊涂蜻蜓为你收集整理的Pytorch优化器的权重衰减(weight_decay)的全部内容,希望文章能够帮你解决Pytorch优化器的权重衰减(weight_decay)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(57)

评论列表共有 0 条评论

立即
投稿
返回
顶部