概述
公众号:尤而小屋
作者:Peter
编辑:Peter
本文主要是介绍的自己在平时使用Pandas处理数据过程中接触到的高频技巧。以前的Pandas文章有对不同知识点的拆解,欢迎阅读。
data:image/s3,"s3://crabby-images/80a0d/80a0d5457c54d247e5b2755ed619240e793edb89" alt="61b1d04ed99eb3c4e578c1d8fea42a85.png"
Pandas连载文章
图解Pandas数据合并:concat、join、append
创建DataFrame:10种方式任你选
赞!五花八门的Pandas筛选数据
数据处理基石:数据探索
data:image/s3,"s3://crabby-images/77e7f/77e7fbc8662844a347a37255300884e0ff883ea3" alt="91e28d16c53779d46d8fa96e0a693687.png"
高频技巧
使用的技巧主要是下图涉及到的:
data:image/s3,"s3://crabby-images/49b68/49b68ecbf2c55ea56c9098a2566745f94df1b880" alt="428735241c3139eb41ffb0ba3b15c738.png"
import pandas as pd
import numpy as np
导入文件
Pandas能够读取很多文件:Excel、CSV、数据库、TXT,甚至是在线的文件都是OK的
data:image/s3,"s3://crabby-images/b611f/b611fd65b34b3577a6903a02fed7a6fa053c2ab5" alt="7619a8dc39ce927df8af6858995592f7.png"
创建DataFrame
在以前的文章中介绍过10种DataFrame的方法
data:image/s3,"s3://crabby-images/745c2/745c22e367a076ddc1c5461baa255083eac4825c" alt="e3e524bc82061ef3d0d2b2c4a7f4d93b.png"
查看头尾数据
头尾都是默认5行数据,可以指定行数
# df2.head() 默认头部5行
df2.head(3) # 指定3行
# df2.tail() 默认尾部5行
df2.tail(2) # 指定尾部2行
显示全部列名
data:image/s3,"s3://crabby-images/ceff3/ceff30d980ae46978923b014b948f9afd4ac735f" alt="3259ed6cdfe16a468d07f8b924a36cc7.png"
显示索引
data:image/s3,"s3://crabby-images/50cda/50cda7fec886254bb64023f9a84d8e92ec2264d6" alt="19a28f2d3be35709dc2c08e8fa37b2d6.png"
查看列的数据类型
data:image/s3,"s3://crabby-images/dc2bb/dc2bb2411a83c37abe9614eecd8c31025831974c" alt="e6657f809d1ea71710dd20519fe2c578.png"
查看行列数
data:image/s3,"s3://crabby-images/3e706/3e706e4a033cd7f4565b1c8e5ba752932efdf288" alt="3f37c2f45bff064a81ac0e0a5af407cd.png"
查看数据大小
data:image/s3,"s3://crabby-images/9a9a3/9a9a3d2f77832ea3404a17d4740555832af9edfc" alt="026aff12d5168ef335fd2706974b1b52.png"
查看缺失值
data:image/s3,"s3://crabby-images/5f5b6/5f5b6c51f102aea3c7913b2abde3d897808ae0f1" alt="d2d28994806c411869c6328580197101.png"
修改列名
两种方式:使用rename函数和直接使用columns属性
data:image/s3,"s3://crabby-images/ab043/ab043fbac75570f5ff39d70332c4127e12be0113" alt="3a25bc83295c88c0122b766520f494aa.png"
data:image/s3,"s3://crabby-images/fc970/fc970d2cfe006f54223a4419e02bf0de420f10c6" alt="b9fe1cc0ffa09dfc0a8f7eff8f56effc.png"
统计元素
统计每个元素的个数
data:image/s3,"s3://crabby-images/0d4b0/0d4b0c524b5aabbc3d2e05d2075990e96f604273" alt="1e96211fb64ee4b8f08b7ece1a137fa5.png"
转成列表数据
data:image/s3,"s3://crabby-images/cd474/cd47488baa904fd2ed5ec0b1973ece4bc522e98d" alt="2967d2ecbec615757842c08133e71745.png"
提取列中数据
data:image/s3,"s3://crabby-images/0bcb4/0bcb44b06afea2eeeab3d508419c93c331510b33" alt="75964e2f3357f555a8562f3ac9ed113c.png"
提取文本数据
data:image/s3,"s3://crabby-images/050a2/050a2a9d7b5321ed4dcdc46a39787f39b06e51e9" alt="9c01863c1dfac2a21ad8e68a272d65db.png"
数值范围数据提取
data:image/s3,"s3://crabby-images/cc39a/cc39a12b368ff52097e7ab90c631745e3b4082d2" alt="40dc8a28dd0d64f6ba2a889e2580c79c.png"
提取整列数据
data:image/s3,"s3://crabby-images/fffb2/fffb2af3f70b120196ce8781ed9ae40720e3ee31" alt="fd1b63e36f2b396862e6490a4348b3fb.png"
data:image/s3,"s3://crabby-images/d1c03/d1c0357a2e6b61008c0687c26d8337b54ffc5b66" alt="b73067251c4a3d18e4f811ef419184db.png"
缺失值填充
指定填充的值
用计算值
用其他值
data:image/s3,"s3://crabby-images/945d0/945d0f67dbc944fc208dc520f90f8a0de552135d" alt="d8db732f5ca792f8dd1eb3ebc0289f5c.png"
数据去重
data:image/s3,"s3://crabby-images/513b9/513b9fd66f33f0360fa2c4114523a8f35b3a9ef9" alt="e63712cd4b2a9bf3b93f6d0455a2be91.png"
计算统计值
计算统计值,比如最值和均值等
data:image/s3,"s3://crabby-images/63cd1/63cd137f352b6ab6cdbebfd7e4eab6906b583730" alt="0aaf5f6e5abd7773398537dffe9fdb89.png"
计算中位数
data:image/s3,"s3://crabby-images/73cc6/73cc6381f890ad28c2da2602e64dbd0b3bd13988" alt="652aec3505d63a868569b4a483774b5c.png"
提取最值所在的行
data:image/s3,"s3://crabby-images/f6943/f69437dfe29e9ae5887bfd1bf3d153d33711c407" alt="22a47d9250d5932cb7ee9d02d66fcfee.png"
Pandas切片
df2.iloc[22] # 提取某个行的数据
df2.iloc[:,1:6] # 行和列上的切片
data:image/s3,"s3://crabby-images/de23b/de23bdbd39a3001301dde818259ec66c64460111" alt="6693de858c739dca3ff085c3faf93051.png"
大小排序
data:image/s3,"s3://crabby-images/cd034/cd0346eb23d5ff4f09eb6cf537bd24398923afd7" alt="b2ac8714ee03044f6ab1e29d839f3450.png"
分组聚合
使用groupby分组之后,对不同的字段可以使用不同的聚合函数
data:image/s3,"s3://crabby-images/887fd/887fd17afd9c3f60ed62aca4aed02d6d2310af31" alt="111dd0162d62b4c1552d6b596cafe618.png"
索引重排
注意和上面例子的比较。使用的是reset_index函数
data:image/s3,"s3://crabby-images/e7ada/e7adaef24cd3ddd31c5e4476c70553efe40d4ee4" alt="eda3b4a28e12b3aa74f927fcceba224f.png"
去掉原索引
使用索引重排之后我们需要去掉原来的索引;比较上下两个结果的区别。通过drop=True来实现
data:image/s3,"s3://crabby-images/c6888/c6888bf486e684477f6a3b1697182d9cc1229f04" alt="64a520d17827661c4006da94f2d766e7.png"
apply函数
data:image/s3,"s3://crabby-images/e9899/e989933772f5a8c4d96761ad6479018dfdc3135a" alt="6d941df43ef3099433bde0619dc4ef30.png"
两个列相加
data:image/s3,"s3://crabby-images/b5391/b53911f4f38b8acc7a41addbd2bea30726e2a505" alt="2f2036e84913b25cf91afa55b0ad1bfe.png"
data:image/s3,"s3://crabby-images/4492f/4492fde72a3a086e09f89bb57c1097ffb27231b4" alt="0d03b9879ba176d0d11105b75e9c5ec9.png"
DataFrame合并
1、先看看两个原始数据
data:image/s3,"s3://crabby-images/3affc/3affca4cc27b47e5f1df63097952a0327ccdd069" alt="b492419b3bf98448158c4ab7bc5ceb0d.png"
2、默认情况:求的两个DF的交集
data:image/s3,"s3://crabby-images/18838/18838b131ab87fdf8fd431ffa17b7af644acd346" alt="9799c6980041d7b3a4c17f7d3e6ed7d2.png"
3、保留左边全部数据
data:image/s3,"s3://crabby-images/ce1c2/ce1c2fb8709d86d996c4afae0abb098a86d96ec0" alt="a58b31ddc0c44f9d525bc9df9027acd9.png"
4、保留右边全部数据
data:image/s3,"s3://crabby-images/8f570/8f57098b0c889050adac908494124b863542ed6c" alt="e61457c388cc6fdd73bd98effe320368.png"
how="inner"其实就是默认情况:
data:image/s3,"s3://crabby-images/87681/87681d7fdec7c69b7b11f364b1c58556fb37a237" alt="b746479fb138e32874ca65939176f95b.png"
导出数据
导出数据的时候通常是不需要索引的
data:image/s3,"s3://crabby-images/7da81/7da8158a7748c20882f97eb0b62a5c20aaa5b487" alt="5034122a6344ea8fcb39445dfcec3873.png"
往期精彩回顾
适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件
本站qq群851320808,加入微信群请扫码:
最后
以上就是体贴跳跳糖为你收集整理的【Python】30个Pandas高频使用技巧的全部内容,希望文章能够帮你解决【Python】30个Pandas高频使用技巧所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复