概述
更加详细的内容可以查看:https://blog.csdn.net/hhtnan/article/details/80080240 (基本函数整理)
https://blog.csdn.net/LY_ysys629/article/details/54428838
https://www.cnblogs.com/timotong/p/9678490.html
一. DataFrame的创建
创建一个空的dataframe
1 |
|
out:
1 2 |
|
用list的数据创建dataframe:
1 2 3 |
|
out:
1 2 3 4 |
|
用numpy的矩阵创建dataframe
1 2 |
|
用dict的数据创建DataFrame
1 2 |
|
1 2 |
|
读取csv或者excel文件为DataFrame格式
1 |
|
excel一个表格中可能有多个sheet,sheetname可以进行选取
1 |
|
二. DataFrame的一些描述和类型
describe会显示dataframe的一些基本统计数据,数量、均值、中位数、标准差等
head会显示dataframe的前几行,后几行:
1 2 |
|
单独计算某列的统计值
1 2 3 4 5 |
|
查看dataframe的数据类型:
1 |
|
查看dataframe的数据数目:
1 |
|
查看dataframe的形状:
1 |
|
返回列数:
1 |
|
查看横纵坐标的标签名:
1 |
|
三. DataFrame的切片
iloc索引或切片(iloc中只能取整数值):
1 2 3 |
|
loc索引或切片(loc中可以取str):
1 |
|
筛选出dataframe中有某一个或某几个字符串的列:
1 2 |
|
筛选出dataframe中不含某一个或某几个字符串的列,相当于反选
1 |
|
四. 缺失值的处理
缺失值可以删除也可以用均值或者0等数填充:
1 2 |
|
删除缺失值时可以指定列:
1 |
|
五. 去重、删除行或列
去重需要在subset指定哪一列的值进行筛选,如果不选择的话默认整行的值全部一样才去掉
first表示保留第一个出现的值所在行,last表示保留最后一个出现的重复值所在的行,false表示重复的行全部删除
1 |
|
去除有NaN值的行或列(axis=0去除行,=1去除列):
1 2 |
|
去除某一列:
1 |
|
去除含有某一个数的行:
1 2 |
|
六. DataFrame的修改
修改数据类型
1 |
|
修改列名(需要写上所有列名,包括需要修改的和不需要修改的):
1 |
|
修改列名(只需写上需要修改的列)
1 |
|
重排序(by可以取多个列名,默认升序):
1 |
|
1 |
|
1 |
|
修改数据
1 |
|
用已有的列进行运算创建新的列
1 |
|
七. dataframe更改索引
当删除掉不需要的行时,行索引会变的不连续,这时候可以重新设计新的索引
1 2 |
|
设置时间序列为索引
1 2 3 |
|
八. 添加新的行,将两个dataframe连接到一起
axis表示连接的方向,axis=0表示两个dataframe的行数会增加,如果列名相同则直接共用列,如果列名不同会生成新的列;axis=1,表示会加上新的列
1 |
|
在dataframe添加新的行
1 |
|
如果两个dataframe的列名是一样的,也可以用merge:
1 |
|
九. DataFrame的输出
输出为excel或者csv格式,csv文件里的数据被读取时数据类型默认为object,excel则会保留原有的数据类型
1 2 |
|
输出为numpy的矩阵格式
1 |
|
输出为dict格式
1 |
|
最后
以上就是明亮灯泡为你收集整理的python:pandas中dataframe的基本用法汇总 的全部内容,希望文章能够帮你解决python:pandas中dataframe的基本用法汇总 所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复