模型的学习率(learning rate)太高将使网络无法收敛!

92 阅读 0 评论 61 点赞

我是靠谱客的博主刻苦网络，这篇文章主要介绍模型的学习率(learning rate)太高将使网络无法收敛!，现在分享给大家，希望可以做个参考。

博主在跑代码的时候，发现过大的Learning rate将导致模型无法收敛。

主要原因是过大的learning rate将导致模型的参数迅速震荡到有效范围之外.(注：由于pytorch中已封装好的代码对模型参数的大小设置了一个界限，因此模型参数不会无限大)

这篇文章将要探讨一下不同learning rate的情况下，模型的收敛情况.

lr = 0.1，模型收敛得很好。
lr = 0.6，在第8轮中模型的参数由于过大，导致无法正常地求loss值。

在这里插入图片描述

lr = 0.75，过大的learning rate直接导致模型参数大幅震荡。

最后，请再温习一遍这幅图:

最后

以上就是刻苦网络最近收集整理的关于模型的学习率(learning rate)太高将使网络无法收敛!的全部内容，更多相关模型的学习率(learning内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(61)

本文分类：Pytorch
浏览次数：92 次浏览
发布日期：2023-05-07 22:04:02
本文链接：https://www.kaopuke.com/article/k-p-k_14_ujo_6_f4_13__7_k5.html

相关文章

计算机网络笔记（王道考研）第二章：物理层物理层

计算机网络笔记（王道考研）第二章：物理层物理层

计算机网络学习笔记-计算机网络体系结构专用术语前言一、实体二、协议三、服务总结

计算机网络学习笔记-计算机网络体系结构专用术语前言一、实体二、协议三、服务总结

超细致的计算机网络学习笔记--第二章(物理层)--持续更新中……计算机网络–第二章（物理层）

超细致的计算机网络学习笔记--第二章(物理层)--持续更新中……计算机网络–第二章（物理层）

About窗宽窗位

模型的学习率(learning rate)太高将使网络无法收敛!

模型的学习率(learning rate)太高将使网络无法收敛!

计网第一章笔记

准确率、精确率、召回率、F—score比较

准确率、精确率、召回率、F—score比较

【性能方面指标】性能方面指标

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部