概述
通过时间反向传播
从 t=1 t = 1 到 t=τ t = τ 应用如下更新方程:
a(t)=b+Wh(t−1)+Ux(t) a ( t ) = b + W h ( t − 1 ) + U x ( t )
h(t)=tanh(a(t)) h ( t ) = t a n h ( a ( t ) )
o(t)=c+Vh(t) o ( t ) = c + V h ( t )
y^(t)=softmax(o(t)) y ^ ( t ) = s o f t m a x ( o ( t ) )
设损失函数 L(t) L ( t ) 为给定 x(1),...,x(τ) x ( 1 ) , . . . , x ( τ ) 后 y(t) y ( t ) 的负对数似然,则:
L(x,y)=−∑tlogpmodel(y(t)|{ x(1),...,x(τ)}) L ( x , y ) = − ∑ t l o g p m o d e l ( y ( t ) | { x ( 1 ) , . . . , x ( τ ) } )
=−logexp(o(t)y(t))∑iexp(o(t)i) = − l o g e x p ( o y ( t ) ( t ) ) ∑ i e x p ( o i ( t ) )
=−logy^(t) = − l o g y ^ ( t )
其中 i i 为
最后
以上就是专注硬币为你收集整理的RNN 公式及其推导 的全部内容,希望文章能够帮你解决RNN 公式及其推导 所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复