概述
大家好,这是近期学习的data analysis 那本书的总结,发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。
一如往常,在使用Pandas时,我们必须从导入模块开始:
![3c767d3428b73c8290c4fa1e7ee6cb21.png](https://file2.kaopuke.com:8081/files_image/2023110822/3c767d3428b73c8290c4fa1e7ee6cb21.png)
导入之后就可以用read_excel从Excel文件中读取数据了。最简单方法是将文件名作为字符串传递。如果我们不传递任何其他参数(例如工作表名称,它将默认读取第一张工作表。在第一个示例中,我将不使用任何参数,如图,我直接用以下代码打开了桌面上的一个名字为“attention of tweets.xlsx”的文件:
![ea86c62b1a7cdff7ff4be8e5354bba44.png](https://file2.kaopuke.com:8081/files_image/2023110822/ea86c62b1a7cdff7ff4be8e5354bba44.png)
预览文件内容如下图:
![b8a91ab5b9fe86854c5c4f8fa95abdf7.png](https://file2.kaopuke.com:8081/files_image/2023110822/b8a91ab5b9fe86854c5c4f8fa95abdf7.png)
在这里,默认情况下,使用read_excel时,Pandas将为数据框分配一个数字索引或行标签。
如果您有一列数据可以用作更好的索引列,我们可以通过将index_col参数设置新的索引列。在下面的示例中,我们使用“日期”列作为索引。
![1ec7c5193da6707521077997b651fab8.png](https://file2.kaopuke.com:8081/files_image/2023110822/1ec7c5193da6707521077997b651fab8.png)
得到如下图:
![afd5f10c8d05112fe2e930f5f83fb170.png](https://file2.kaopuke.com:8081/files_image/2023110822/afd5f10c8d05112fe2e930f5f83fb170.png)
使用read_excel读取特定列
使用Pandas read_excel时,我们将自动从Excel文件中获取所有列。如果由于某种原因我们不想解析Excel文件中的所有列,则可以使用参数 usecols。假设我们只想创建一个具有转发和评论列的数据框。我们可以通过参数usecols做到这一点:
![d44bbc57d321aa5eae175c6b60c29ff8.png](https://file2.kaopuke.com:8081/files_image/2023110822/d44bbc57d321aa5eae175c6b60c29ff8.png)
得到如下结果:
![27de336b2c42b59f2d0bb1635a496e2c.png](https://file2.kaopuke.com:8081/files_image/2023110822/27de336b2c42b59f2d0bb1635a496e2c.png)
读取Excel文件时如何跳过行
现在,复习一下在使用Pandas加载Excel文件时如何跳过行。对于这个读取的上面的excel示例
![abc2afd4d9c2f096191a478d559f5292.png](https://file2.kaopuke.com:8081/files_image/2023110822/abc2afd4d9c2f096191a478d559f5292.png)
通过上面的代就可以直接跳过头两行,得到如图所示的结果:
![03f1a1c0c9639732572f8d8fe23c3cde.png](https://file2.kaopuke.com:8081/files_image/2023110822/03f1a1c0c9639732572f8d8fe23c3cde.png)
这个操作应该不常用。
将Pandas数据框写入Excel
使用Pandas to_excel方法可以在Python中创建Excel文件。首先,我们将创建一个包含一些变量的数据框,我们将使用字典创建数据框。键将是列名,值将是包含我们的数据的列表:
![630930e3283d16436f4a6f843f77b2bc.png](https://file2.kaopuke.com:8081/files_image/2023110822/630930e3283d16436f4a6f843f77b2bc.png)
然后,我们使用to_excel方法将数据框写入Excel文件。值得注意的是,在下面的代码块中使用Pandas to_excel时,我们不用任何参数。
![a3fbef26009f8474c6c66a8e06f1db52.png](https://file2.kaopuke.com:8081/files_image/2023110822/a3fbef26009f8474c6c66a8e06f1db52.png)
这个时候在目录中就生成了一个名叫“NamesAndAges.xlsx"的文件,打开它,得到如下图:
![5b42aee9458bd571b79855962692a0d9.png](https://file2.kaopuke.com:8081/files_image/2023110822/5b42aee9458bd571b79855962692a0d9.png)
可以看到我们在Excel文件中获得了一个包含数字的新列。这些是数据框的索引。
如果我们希望将工作表命名为其他名称,并且也不希望引入索引列,那么在使用Pandas写入Excel时可以添加以下参数:
![2fd2f96183b37f73248a9b5529de0b25.png](https://file2.kaopuke.com:8081/files_image/2023110822/2fd2f96183b37f73248a9b5529de0b25.png)
这样就会得到一个叫“Names and Ages”的工作表,并且不含自动加的索引列。
好了,今天就是这些,希望看完的朋友可以留言建议,一起交流成长!
最后
以上就是英勇睫毛为你收集整理的java读写excel文件_Pandas Excel教程:如何读写excel文件的全部内容,希望文章能够帮你解决java读写excel文件_Pandas Excel教程:如何读写excel文件所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复