我是靠谱客的博主 香蕉冰棍,最近开发中收集的这篇文章主要介绍数据归一化,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

version:python 3.6
环境:anaconda/JupyterLab 0.27.0
操作系统:Windows 10

数据处理时经常用到数据归一化和标准化,但是一个数据集,不同字段之间的量纲和数据大小分布不一致。所以需要按列归一化,而不是直接对所有数据归一化。
下面是我写的函数,可以直接调用:

def minmax_scale(data):
    for col in feature_list:
        MAX = data[col].max()
        MIN = data[col].min()
        MEAN = data[col].mean()
        if MAX > MIN:
            data[col] = data[col].apply(lambda x: (float(x) - float(MIN)) / (float(MAX) - float(MIN))).fillna(MEAN)
        else:
            data[col] = (data[col] / float(MAX)).fillna(MEAN)
    return data

最后

以上就是香蕉冰棍为你收集整理的数据归一化的全部内容,希望文章能够帮你解决数据归一化所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(69)

评论列表共有 0 条评论

立即
投稿
返回
顶部