我是靠谱客的博主 乐观煎蛋,最近开发中收集的这篇文章主要介绍Python:Pandas:DataFrame基础(1),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

引子


在用python解决实际问题时,从磁盘文件读取数据是经常要做的工作。这篇文章
主要说一下python读取excel文件中的数据。利用python读取excel中的数据是一件
来读取的方式,在我看来这种方式已经足够简单了,以至于我不想再了解其他的方式。
要想使用这种方式,首先需要在代码中引入两个包:
`import numpy as np`
`import pandas as pd`
然后仅需要一行代码即可完成python读取excel的操作,这里给一个实际的代码:
`data = pd.read_excel('D:/homework.xlsx', index_col=0)`
"index_col=0"可以这样理解:把homework.xlsx中的第一列设置为主键。

步入正题


以上这些,都太简单,不足以作为本文的正题。问题是,当把homework.xlsx
类型呢?这里不能想当然地认为data的访问方式类似于二维数组,这是大错特错的,
当然也不要以为data的访问方式很繁琐,如果真的很繁琐的话,我也不会在众多的读
的,记住了好几次,忘记了好几次。
下面主要通过实例的方式讲解:
首先,我得把excel中的数据读到data变量中

import numpy as np
import pandas as pd
data = pd.read_excel('D:/homework.xlsx', index_col=0)
print(data)

将data输出到控制台上,结果如下:

这里写图片描述


其中,“纳税人编号”是主键,并且,data中索引为0的列是“销售类型”这一列,被设置为主键的列不能算。

1、使用head()方法可以查看data的前几行数据(默认是前5行):


print(data.head())

输出结果如下:

这里写图片描述


除了默认前5行,也可以指定是前几行,例如:

print(data.head(3))

输出结果如下:

这里写图片描述


同理,使用tail()方法可以查看后几行数据(默认是后5行)。

2、查看data的索引


print(data.index)

输出结果如下:

这里写图片描述

3、查看data的列名


print(data.columns)

输出结果如下:

这里写图片描述


同理,查看data的数据值用data.values,查看描述性统计用data.describe(),转置数据用data.T。
对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序,如data.sort(columns = u'维修毛利'),输出结果如下:

这里写图片描述

结束:好了,这篇文章到此结束,后面的文章有进一步的介绍。

最后

以上就是乐观煎蛋为你收集整理的Python:Pandas:DataFrame基础(1)的全部内容,希望文章能够帮你解决Python:Pandas:DataFrame基础(1)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(65)

评论列表共有 0 条评论

立即
投稿
返回
顶部