【笔记】为什么需要正则化?文字来源
ps: 本文文字摘自网络在解决实际问题的过程中,我们会倾向于用复杂的模型来拟合复杂的数据,但是使用复杂模型会产生过拟合(overfitting)的风险,而正则化就是常用的减少过拟合风险的工具之一。过拟合是指模型在训练集上误差很小,但是在测试集上表现很差(即泛化能力 [generalization ability] 差),过拟合的原因一般是由于数据中存在噪声或者用了过于复杂的模型拟合数据,而模型却过于复杂,过分地拟合噪声(noise)和异常值(outliers)。在训练数据不够多时,或者overt