凶狠发带

文章
7
资源
0
加入时间
2年10月21天

理论推导RNN梯度消失和梯度爆炸的原因

RNN梯度消失和梯度爆炸的原因  RNN的提出是为了解决网络无法利用历史信息的问题,但由于RNN具有梯度消失和梯度爆炸的问题,导致RNN不能存储长期记忆。网络结构  首先来看RNN的结构,如下图1所示:  上图的结构很好理解,xtx_{t}xt​为网络输入,AAA为隐藏层,hth_{t}ht​为网络输出。既然我们想利用之前的历史信息,那我们就将网络在上一时刻的输出保存下来,作为当前时刻的...