LSTM解决梯度消失和爆炸情况
1. LSTM避免RNN的梯度消失(gradient vanishing) 2. LSTM避免RNN的梯度爆炸 3. GRU 与 LSTM 比较 4 Batch Normalization 到 Group Normalization Batch Normalization Group Normalization ...