《动手学深度学习》第十七天---批量归一化
由于在看论文的时候设涉及批量归一化的知识,所以决定提前学这一节。批量归一化(batch normalization)的提出是为了解决对深层神经网络,即使输入数据已做标准化,训练中模型参数的更新依然很容易造成靠近输出层输出的剧烈变化的问题。(一)批量归一化层对全连接层进行批量归一化操作:我们将批量归一化层置于全连接层中的仿射变换和激活函数之间。也就是说,对于全连接层的输入u,先进行 x=W...