我是靠谱客的博主 超级滑板,最近开发中收集的这篇文章主要介绍python数据可视化——处理时间序列数据,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

在这里主要使用pandas对数据进行处理。

首先把数据读入pandas

data = pd.read_csv("D:\...存放数据的路径..\数据文件名.csv", encoding="gbk")

对于时间数据的那一列,将其转换为DATE类型

data['TIME'] = pd.to_datetime(data['TIME'])

如果对于时间数据,想单独提取某一月份或者某一日期或者某一周,可以创建一个新列或者直接在时间列TIME上进行更改,这里使用了一个lamda函数,做法大致如下。

data['TIME'] = data['TIME'].apply(lambda v: datetime.strftime(v, '%Y-%m-%d'))
# 原列上更改
data['MONTH'] = data['TIME'].apply(lambda v: datetime.strftime(v, '%Y-%m'))
# 添加月份新列

然后去掉重复行,过多的重复数据不利于很好地找到特殊数据的占比等

data = data.drop_duplicates()
# 将重复行去掉

通常都会把时间序列数据作为索引,在图像的绘制中,索引数据默认作为x轴。
将该列设置为索引后,对其进行操作可能不方便,取消索引的命令:

data = data.set_index(['TIME'])
# 将TIME列设为索引
data = data.reset_index()
# 取消索引

最后

以上就是超级滑板为你收集整理的python数据可视化——处理时间序列数据的全部内容,希望文章能够帮你解决python数据可视化——处理时间序列数据所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(57)

评论列表共有 0 条评论

立即
投稿
返回
顶部