data.head
读取数据前五行,当数据太大时,对查看数据是否正确。
data.query
记录满足查找条件的行索引
复制代码
1
2data.query("x<2.5 & x>2 & y<1.5 & y>1.0")
时间处理
复制代码
1
2
3
4time = pd.to_datetime(data["time"], unit="s") #转成时间 pd.DatetimeIndex(time)
data.groupby(“特征”).count()
对某一特征进行统计
缺失值处理
复制代码
1
2
3
4# True:直接修改原对象,改为平均值 # False:创建一个副本,修改副本,原对象不变(缺省默认) x["age"].fillna(x["age"].mean(),inplace = true)
最后
以上就是怕黑大象最近收集整理的关于pandas数据预处理的全部内容,更多相关pandas数据预处理内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复