本人认为:
lstm只能缓解梯度消失,并不能完全解决;因为最新的状态单元可以是过去的一个线性组合,过去的信息传递到现在主要是由每个时间步的遗忘门参数连乘决定的;
而rnn是过去时间序列的一个连乘;由参数w与tanh激活函数的导数值连乘而得到的;
最后
以上就是坦率方盒最近收集整理的关于lstm解决梯度消失的全部内容,更多相关lstm解决梯度消失内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
本人认为:
lstm只能缓解梯度消失,并不能完全解决;因为最新的状态单元可以是过去的一个线性组合,过去的信息传递到现在主要是由每个时间步的遗忘门参数连乘决定的;
而rnn是过去时间序列的一个连乘;由参数w与tanh激活函数的导数值连乘而得到的;
以上就是坦率方盒最近收集整理的关于lstm解决梯度消失的全部内容,更多相关lstm解决梯度消失内容请搜索靠谱客的其他文章。
发表评论 取消回复