重要小松鼠

文章
2
资源
0
加入时间
2年10月24天

机器学习系列文章——特征的处理与选择(归一化、标准化、降维、PCA)

一、特征处理特征处理是通过特定的统计方法,将数据转化成算法要求的数据。其API为sklearn.preprocessing。先来看一组数据:第一组中的特征1 相比于特征2而言大了几十倍,在正常处理时这些点即可视为异常点,影响统计结果分析。采用特征处理后转变为右侧的数据,可以更加方便的处理而不会产生异常值。常见的处理方法如下:数据类型处理方法数值型数据归一化、标准化、缺失值类别型数据one hot编码时间型数据时间的切分( 一)归一化归一化是通过对原始数

算术运算符的运用

#运算符#1.算术运算符:+ - * / div % modSELECT 100,100+0,100-0,100+50,100+50-30,100+35.5,100-35.5FROM DUAL;#在SQL中,+ 没有连接的作用,就表示加法运算此时,会将字符串转换为是数值(隐式转换)SELECT 100+'1' #在java中,结果为1001FROM DUAL;SELECT 100+'a' # 此时将'a'看作0处理FROM DUAL;SELECT 100+NULL # NULL参