学习心得：不同优化求解器的特点常用算法算法优缺点

119 阅读 0 评论 79 点赞

我是靠谱客的博主无情微笑，这篇文章主要介绍学习心得：不同优化求解器的特点常用算法算法优缺点，现在分享给大家，希望可以做个参考。

在神经网络中有几种常用的优化求解算法，在这里主要记录一下各个算法的优势和缺点，对选择提供一些依据。

常用算法

sgd：随机梯度下降法。每次从训练集中随机选择batch_size个样本进行正向传播计算平均loss，再进行反向传播更新权重参数。
Momentum SGD和Nesterov Momentum（下面统称动量法）：增加了动量项。
Adagrad：在学习率上做文章。固定的学习率除以每个参数的历史更新累加值。
Adadelta：直接对每次更新的△W进行改进，学习率由一个除法得到，分母是历史的梯度累加，分子是历史的参数更新累加值。
RMSprop：Hinton提出的。固定的学习率除以参数的历史更新累加值。看起来与Adagrad很像，但是RMSprop是按权重累加，解决了Adagrad越加越大的问题。
Adam：同时使用了动量和梯度的平方和加权。

算法优缺点

算法名称	优点	缺点
sgd	每次都能直奔目标点，不走弯路	收敛速度慢，容易陷入局部最优点
动量法	收敛速度比较快，具备跳出局部最优点的能力	由于动量比较大，因此经常容易冲过目标点，然后再往回进行收敛
Adagrad	对不同参数的学习率区别对待，前期收敛速度比较快，不会陷入局部最优点	训练后期学习率过小导致收敛速度变慢
Adadelta	不需要人工给定学习率，收敛速度快，不会陷入局部最优点	容易冲过全局最优点
RMSprop	Hinton已经给出学习率，收敛速度快，不会陷入局部最优点	容易冲过全局最优点

实际使用中，可以选择目前最常用的几个，如RMSprop、Adam等，效果一般不错。不过据说Adam会比同样达到最优的sgd在性能上低1个百分点。

最后

以上就是无情微笑最近收集整理的关于学习心得：不同优化求解器的特点常用算法算法优缺点的全部内容，更多相关学习心得：不同优化求解器内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(79)

本文分类：机器学习
浏览次数：119 次浏览
发布日期：2023-09-25 13:56:08
本文链接：https://www.kaopuke.com/article/k-p-k_14_uzocf0_14__23__18_y.html

相关文章

OMPL学习--第二篇之Moveit!与OMPL的交互机制

OMPL学习--第二篇之Moveit!与OMPL的交互机制

机器学习算法疗程(最优化)

0-1整数规划的LINGO求解

0-1整数规划的LINGO求解

qp_spline_st_speed_optimizer_cn

qp_spline_st_speed_optimizer_cn

学习心得：不同优化求解器的特点常用算法算法优缺点

学习心得：不同优化求解器的特点常用算法算法优缺点

$vue中通过方法返回data中的对象是这个{__ob__: Observer}$

vue中通过方法返回data中的对象是这个{ob: Observer}

OMPL 入门Tutorial 6：基准规划器(Benchmarking planner)

OMPL 入门Tutorial 6：基准规划器(Benchmarking planner)

MoveIt » Tutorials » OMPL Planner 中文翻译OMPL 规划器

MoveIt » Tutorials » OMPL Planner 中文翻译OMPL 规划器

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部