机器学习-创建岭回归器
线性回归的主要问题是对异常值敏感。在真实世界的数据收集过程中,经常会遇到错误的度量结果。而线性回归使用的是普通最小二乘法,其目标是使平方误差最小化。这时,由于异常误差的绝对值很大,因此破坏整个模型。普通最小二乘法在建模的时候会考虑每个数据点的影响,为了避免这个问题,我们引入正则化项的系数作为阈值来消除异常值的影响。这个方法被称为岭回归。#打开文件,获取数据import sysimport