LSTM如何解决梯度弥散和爆炸问题
之前看了很多讲LSTM优点的,但是几乎没有一篇能让我解开心中的疑惑:LSTM究竟怎么解决梯度弥散的?直到看到这篇文章“苏剑林. (2020, Nov 13). 《也来谈谈RNN的梯度消失/爆炸问题 》[Blog post]. Retrieved fromhttps://kexue.fm/archives/7888”,个人认为这是我看到的第一篇讲清楚LSTM解决梯度弥散机制的文章,特此记录,同时感谢大佬@苏剑林!原文地址:https://kexue.fm/archives/7888...