概述
version:python 3.6
环境:anaconda/JupyterLab 0.27.0
操作系统:Windows 10
数据处理时经常用到数据归一化和标准化,但是一个数据集,不同字段之间的量纲和数据大小分布不一致。所以需要按列归一化,而不是直接对所有数据归一化。
下面是我写的函数,可以直接调用:
def minmax_scale(data):
for col in feature_list:
MAX = data[col].max()
MIN = data[col].min()
MEAN = data[col].mean()
if MAX > MIN:
data[col] = data[col].apply(lambda x: (float(x) - float(MIN)) / (float(MAX) - float(MIN))).fillna(MEAN)
else:
data[col] = (data[col] / float(MAX)).fillna(MEAN)
return data
最后
以上就是香蕉冰棍为你收集整理的数据归一化的全部内容,希望文章能够帮你解决数据归一化所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复