我是靠谱客的博主 乐观小猫咪,最近开发中收集的这篇文章主要介绍pandas学习笔记-基础,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一、文件读取与写入
1.读取
csv格式:df = pd.read_csv(‘文件路径/table.csv’)
txt格式:df_txt = pd.read_table(‘文件路径/table.txt’) #可设置sep分隔符参数
xls或xlsx格式:
df_excel = pd.read_excel(‘文件路径/table.xlsx’)#需要安装xlrd包
2.写入
csv格式:df.to_csv(‘data/new_table.csv’)
#df.to_csv(‘data/new_table.csv’, index=False) #保存时除去行索引
xls或xlsx格式:#需要安装openpyxl
df.to_excel(‘data/new_table2.xlsx’, sheet_name=‘Sheet1’)
二、基本数据结构
1.series
对于一个Series,其中最常用的属性为值(values),索引(index),名字(name),类型(dtype)
2.dataframe
(1)创建
(2)取出某一列
(3)修改行名或列名
(4)调用属性和方法
(5)索引对齐:
df1 = pd.DataFrame({‘A’:[1,2,3]},index=[1,2,3])
df2 = pd.DataFrame({‘A’:[1,2,3]},index=[3,1,2])
df1-df2 #由于索引对齐,因此结果不是0
(6)列的删除与添加:对于删除而言,可以使用drop函数或del或pop
df.drop(index=‘五’,columns=‘col1’) #设置inplace=True后会直接在原DataFrame中改动;
pop方法直接在原来的DataFrame上操作,且返回被删除的列,与python中的pop函数类似。
可以直接增加新的列,也可以使用assign方法,但assign方法不会对原DataFrame做修改。
(7)根据类型选择列:
(8)将Series转换为DataFrame:
s.to_frame()#s为series
(9)使用T符号可以转置:
s.to_frame().T
三常用基本函数
1.hesd和tail
2.unique和nunique:
nunique显示有多少个唯一值
df[‘Physics’].nunique()
unique显示所有的唯一值
df[‘Physics’].unique()
3.count和value_counts
count返回非缺失值元素个数
value_counts返回每个元素有多少个
4.describe和info
info函数返回有哪些列、有多少非缺失值、每列的类型;
describe默认统计数值型数据的各个统计量;
可以自行选择分位数:df.describe(percentiles=[.05, .25, .75, .95])
5.idxmax和nlargest
idxmax函数返回最大值,在某些情况下特别适用,idxmin功能类似;
nlargest函数返回前几个大的元素值,nsmallest功能类似
6.clip和replace
clip和replace是两类替换函数,
clip是对超过或者低于某些值的数进行截断;
replace是对某些值进行替换,通过字典,可以直接在表中修改:df.replace({‘Address’:{‘street_1’:‘one’,‘street_2’:‘two’}}).head()
7.apply函数:
apply是一个自由度很高的函数,
对于Series,它可以迭代每一列的值操作:df[‘Math’].apply(lambda x:str(x)+’!’).head() #可以使用lambda表达式,也可以使用函数
对于DataFrame,它可以迭代每一个列操作:df.apply(lambda x:x.apply(lambda x:str(x)+’!’)).head() #这是一个稍显复杂的例子,有利于理解apply的功能
四、排序
1.索引排序
df.set_index(‘Math’).head() #set_index函数可以设置索引,将在下一章详细介绍;
df.set_index(‘Math’).sort_index().head() #可以设置ascending参数,默认为升序,True
2.值排序
df.sort_values(by=‘Class’).head()
多个值排序,即先对第一层排,在第一层相同的情况下对第二层排序
df.sort_values(by=[‘Address’,‘Height’]).head()

最后

以上就是乐观小猫咪为你收集整理的pandas学习笔记-基础的全部内容,希望文章能够帮你解决pandas学习笔记-基础所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部