概述
(1)查看数据函数
当收集到某一csv文件数据时,常用的查看函数
inspect_dataset(df_data)
def inspect_dataset(df_data): """ 查看加载的数据基本信息 """ print '数据集基本信息:' print df_data.info() print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1]) print '数据预览:' print df_data.head()
此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化
(2)处理缺失数据函数
当数据文件中有缺失数据时,用此函数处理Na数据:
def process_missing_data(df_data):
"""
处理缺失数据
"""
if df_data.isnull().values.any():
# 存在缺失数据
print '存在缺失数据!'
df_data = df_data.fillna(0.)
# 填充nan
# df_data = df_data.dropna()
# 过滤nan
return df_data
#返回数据
#return df_data.reset_index()
#此为返回重置索引
此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,
当需要直接过滤时时用df_data.dropna(),
当需要填充为数值或字符串时用df_data.fillna(0.)
当需要返回数据时用return df_data
当需要返回其处理后数据的重置索引时,用reset_index()
最后
以上就是土豪信封为你收集整理的pandas常用的数据分析函数(一)的全部内容,希望文章能够帮你解决pandas常用的数据分析函数(一)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复