神经网络中的BPTT算法简单介绍 RNN（Recurrent Neural Network）

172 阅读 0 评论 114 点赞

我是靠谱客的博主洁净秀发，这篇文章主要介绍神经网络中的BPTT算法简单介绍 RNN（Recurrent Neural Network），现在分享给大家，希望可以做个参考。

首先来看下RNN的一个循环网络结构图：

RNN（Recurrent Neural Network）

rnn结构

在时间维度上，我们将RNN进行展开，以便能够更好地来观察：
这里写图片描述
主要的参数就是三部分：在RNN中每一个时间步骤用到的参数都是一样的，要理解清楚的是：一般来说，每一时间的输入和输出是不一样的，比如对于序列数据就是将序列项依次传入，每个序列项再对应不同的输出（比如下一个序列项）：
这里写图片描述

BPTT（Back Propagation Through Time）算法

将RNN展开之后，似乎一切都很明了了，前向传播（Forward Propagation）就是依次按照时间的顺序计算一次就好了，反向传播（Back Propagation）就是从最后一个时间将累积的残差传递回来即可，跟普通的神经网络训练并没有本质上的不同。

前向传播

直接上公式啦：
这里写图片描述
本文用到的公式基本来自Alex的论文，其中a表示汇集计算的值，b表示经过激活函数计算的值，w是不同节点之间连接的参数（具体睡谁连谁看下标），带下标k的是输出层，带下标h的是隐藏层相关的，除此之外你看到所有带括号的的函数都是激活函数， ϵ 和 δ 的定义看公式， L 是最后的Loss function，这里没有给出具体的计算方法，因为这和NN是一样的，可以看到输出层和普通的NN是完全一样的，接收隐藏层传入的数据并乘以参数求和，只是每一个计算出来的值都有个时间上标t，表示它是t时刻的那个节点。