data.head
读取数据前五行,当数据太大时,对查看数据是否正确。
data.query
记录满足查找条件的行索引
data.query("x<2.5 & x>2 & y<1.5 & y>1.0")
时间处理
time = pd.to_datetime(data["time"], unit="s")
#转成时间
pd.DatetimeIndex(time)
data.groupby(“特征”).count()
对某一特征进行统计
缺失值处理
# True:直接修改原对象,改为平均值
# False:创建一个副本,修改副本,原对象不变(缺省默认)
x["age"].fillna(x["age"].mean(),inplace = true)
最后
以上就是怕黑大象最近收集整理的关于pandas数据预处理的全部内容,更多相关pandas数据预处理内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复