《动手学深度学习》Task03打卡针对过拟合、欠拟合及其解决方案的认识针对梯度消失、梯度爆炸的认识针对循环神经网络进阶的认识
针对过拟合、欠拟合及其解决方案的认识欠拟合(underfitting):模型无法得到较低的训练误差;过拟合(overfitting):模型的训练误差远小于它在测试数据集上的误差。给定训练数据集,模型复杂度和误差之间的关系:当对该隐藏层使用丢弃法时,该层的隐藏单元将有一定概率被丢弃掉。设丢弃概率为ppp,那么有ppp的概率hih_ihi会被清零,有1−p1-p1−p的概率hi...