《动手学深度学习》Task06打卡批量归一化和残差网络针对凸优化的认识针对梯度下降的认识
批量归一化和残差网络批量归一化(BatchNormalization)针对深度模型训练:以batch为单位,对每个batch计算均值和方差。预测:用移动平均估算整个训练数据集的样本均值和方差。残差网络(ResNet)针对深度CNN网络深度问题残差块(Residual Block)左边:f(x)=x右边:f(x)-x=0 (易于捕捉恒等映射的细微波动)在残差块中,输⼊可通...