概述
相关免费学习推荐:python视频教程
1,导入 python 库、读取 excel 数据
# 导入 pandas 库import pandas as pd# read_excel() 读取 excel 数据# DataFrame() 将读取到的数据转换为 DataFrame 数据df = pd.DataFrame(pd.read_excel('data.xlsx'))
登录后复制
2,数据清洗(去除空值)
# dropna() 函数去除 df 数据表中存在空值的所有行df.dropna(how='any')# mean() 函数计算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函数对存在的空值进行填充,将 age_pre 的值填充到字段为空的值内面df['age'].fillna(age_pre)
登录后复制
3,数据清洗(清除字段中的空格)
# 清除字段的空格df['name'] = df['name'].map(str.strip)
登录后复制
4,数据清洗(对某个列进行重命名)
# rename() 函数对列进行重命名df.rename(columns={'name': 'name_new'})
登录后复制
5,数据清洗(清除某一列中的重复值)
# 从前往后查找某个列中的重复值,如果存在则清除后面所出现的重复值df['name'].drop_duplicates()# 从后往前查找某个列中的重复值,如果存在则清除前面所出现的重复值df['city'].drop_duplicates(keep='last')# 两种正好是按照相反的清除顺序
登录后复制
6,数据清洗(数据值替换)
# 将某一列中的具体值进行替换df['name'].replace('laow', 'lwsbc')
登录后复制
相关免费学习推荐:python教程(视频)
以上就是python 操作 excel 系列之:数据清洗的详细内容,更多请关注靠谱客其它相关文章!
最后
以上就是快乐春天为你收集整理的python 操作 excel 系列之:数据清洗的全部内容,希望文章能够帮你解决python 操作 excel 系列之:数据清洗所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复