RNN公式详细推导(结合广为流传的八位二进制加法代码)与代码详解
最近在查找RNN的公式详解中,发现大多数的公式都是一通链式求导结束,与网络上广为流传的八位二进制代码的计算过程完全不符,经过研究推导,觉得有必要给后来的同学推导一下代码中的计算过程。(代码附在文后)先上图,RNN的结构图都是这样,按时间展开,S是隐藏层和输出层的激活函数,这里用Sigmoid,求导比较特殊,W是权重角标表示走向,O是输出层,I是输入层,H是隐藏层,a是单元的输入,b是单元的输出,上下角标是层和时间序列,x是输入层的输入,这里方便,就不给单元设置阈值了,有的代码里会有一个阈..