RNN,GRU和LSTM模型比较
文中图片来源:吴恩达老师的深度学习视频视频链接:https://www.bilibili.com/video/av49445369?p=152对于标准的RNN来说,它是利用前一时刻的隐藏单元和该时刻的输入一起学习,但是当小序列的相关信息相隔较长时,普通RNN常常不能学习的很好。举个例子,(1)如果我们要预测“the clouds are in the sky”的最后一个单词,因为只在这一个...