我是靠谱客的博主 体贴跳跳糖,最近开发中收集的这篇文章主要介绍【Python】30个Pandas高频使用技巧,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

公众号:尤而小屋
作者:Peter
编辑:Peter

本文主要是介绍的自己在平时使用Pandas处理数据过程中接触到的高频技巧。以前的Pandas文章有对不同知识点的拆解,欢迎阅读。

61b1d04ed99eb3c4e578c1d8fea42a85.png

Pandas连载文章

图解Pandas数据合并:concat、join、append

创建DataFrame:10种方式任你选

赞!五花八门的Pandas筛选数据

数据处理基石:数据探索

91e28d16c53779d46d8fa96e0a693687.png

高频技巧

使用的技巧主要是下图涉及到的:

428735241c3139eb41ffb0ba3b15c738.png
import pandas as pd
import numpy as np

导入文件

Pandas能够读取很多文件:Excel、CSV、数据库、TXT,甚至是在线的文件都是OK的

7619a8dc39ce927df8af6858995592f7.png

创建DataFrame

在以前的文章中介绍过10种DataFrame的方法

e3e524bc82061ef3d0d2b2c4a7f4d93b.png

查看头尾数据

头尾都是默认5行数据,可以指定行数

# df2.head()  默认头部5行
df2.head(3)  # 指定3行

# df2.tail()  默认尾部5行
df2.tail(2)  # 指定尾部2行

显示全部列名

3259ed6cdfe16a468d07f8b924a36cc7.png

显示索引

19a28f2d3be35709dc2c08e8fa37b2d6.png

查看列的数据类型

e6657f809d1ea71710dd20519fe2c578.png

查看行列数

3f37c2f45bff064a81ac0e0a5af407cd.png

查看数据大小

026aff12d5168ef335fd2706974b1b52.png

查看缺失值

d2d28994806c411869c6328580197101.png

修改列名

两种方式:使用rename函数和直接使用columns属性

3a25bc83295c88c0122b766520f494aa.png b9fe1cc0ffa09dfc0a8f7eff8f56effc.png

统计元素

统计每个元素的个数

1e96211fb64ee4b8f08b7ece1a137fa5.png

转成列表数据

2967d2ecbec615757842c08133e71745.png

提取列中数据

75964e2f3357f555a8562f3ac9ed113c.png

提取文本数据

9c01863c1dfac2a21ad8e68a272d65db.png

数值范围数据提取

40dc8a28dd0d64f6ba2a889e2580c79c.png

提取整列数据

fd1b63e36f2b396862e6490a4348b3fb.png b73067251c4a3d18e4f811ef419184db.png

缺失值填充

  • 指定填充的值

  • 用计算值

  • 用其他值

d8db732f5ca792f8dd1eb3ebc0289f5c.png

数据去重

e63712cd4b2a9bf3b93f6d0455a2be91.png

计算统计值

计算统计值,比如最值和均值等

0aaf5f6e5abd7773398537dffe9fdb89.png

计算中位数

652aec3505d63a868569b4a483774b5c.png

提取最值所在的行

22a47d9250d5932cb7ee9d02d66fcfee.png

Pandas切片

df2.iloc[22]  # 提取某个行的数据
df2.iloc[:,1:6]  # 行和列上的切片
6693de858c739dca3ff085c3faf93051.png

大小排序

b2ac8714ee03044f6ab1e29d839f3450.png

分组聚合

使用groupby分组之后,对不同的字段可以使用不同的聚合函数

111dd0162d62b4c1552d6b596cafe618.png

索引重排

注意和上面例子的比较。使用的是reset_index函数

eda3b4a28e12b3aa74f927fcceba224f.png

去掉原索引

使用索引重排之后我们需要去掉原来的索引;比较上下两个结果的区别。通过drop=True来实现

64a520d17827661c4006da94f2d766e7.png

apply函数

6d941df43ef3099433bde0619dc4ef30.png

两个列相加

2f2036e84913b25cf91afa55b0ad1bfe.png 0d03b9879ba176d0d11105b75e9c5ec9.png

DataFrame合并

1、先看看两个原始数据

b492419b3bf98448158c4ab7bc5ceb0d.png

2、默认情况:求的两个DF的交集

9799c6980041d7b3a4c17f7d3e6ed7d2.png

3、保留左边全部数据

a58b31ddc0c44f9d525bc9df9027acd9.png

4、保留右边全部数据

e61457c388cc6fdd73bd98effe320368.png

how="inner"其实就是默认情况:

b746479fb138e32874ca65939176f95b.png

导出数据

导出数据的时候通常是不需要索引的

5034122a6344ea8fcb39445dfcec3873.png
 
 

8598d08edc403cfbeaea797e5ec9f186.png

 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群851320808,加入微信群请扫码:

73eed5ff4a3bb7138d064ff6f3985ef6.png

最后

以上就是体贴跳跳糖为你收集整理的【Python】30个Pandas高频使用技巧的全部内容,希望文章能够帮你解决【Python】30个Pandas高频使用技巧所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(42)

评论列表共有 0 条评论

立即
投稿
返回
顶部