概述
padas对列的操作是数据分析常用的操作,本文做些相关介绍
1、loc和iloc
loc适用于索引中的标签。iloc在索引中的位置上起作用。
1.1 loc基于行标签和列标签进行索引
loc先行后列,中间用逗号(,)隔开
df.loc['a','A'] #取a和A对应的数据
df.loc['a':'b',:] #取前两行对应数据
df.loc[:,'A':'B'] #取前两列对应数据
df.loc['a':'b','A':'B'] #取前两行和前两列对应数据
df.loc[['a','d'],['A','D']] #若取第一行和第四行、第一列和第四列对应的数据,则
1.2 iloc 基于行索引和列索引(index,columns)
行索引和列索引都是从 0 开始;如果数据的行标签和列标签名字太长或不容易记,则用 iloc 很方便,只需记标签对应的索引即可
df.iloc[0,0]
df.iloc[0:2,:] #取前两行对应数据
df.iloc[:,0:2] #取前两列对应数据
df.iloc[0:2,0:2] #取前两行和前两列对应数据
df.iloc[[0,3],[0,3]]#取第一行和第四行、第一列和第四列对应的数据
2、统计某一列中各个值的出现次数
比如要统计某列col_name各个值出现的次数,
df.loc[:,col_name].value_counts()
df[col_name].value_counts()
3、删除若干列
dataframe.drop([“a”,“b”,“c”], axis=1) #删除a,b,c列
dataframe.drop(subset=[“a”], axis=1) #删除a列
4、删除列数据
del(dataframe[‘A’]) #删除A列数据
5、增加列数据
dataframe[‘A’] = series #增加新列A,值为series
dataframe[‘A’] = dataframe[‘B’] + 4 #新增列A,为列B的值+4
6、对某一列重新赋值
dataframe[‘A’] = 0 #指定列所有值均为0
7、对值排序
df.sort_values(by=“open”, ascending=False)
df.sort_values(by=[‘open’, ‘high’])
by:指定排序参考的键,单个键或者多个键进行排序,ascending:默认True升序,False降序
8、对索引排序
dataframe.sort_index() ascending:默认True升序,False降序
9、获取列数据
(1)dataframe[‘A’] <=> dataframe.A #新series 通过列索引获取列数据
(2)dataframe[[‘A’]] #新DataFrame 只有一列,双层中括号
(3)dataframe[[‘a’,‘c’]] #新DataFrame 多列,双层中括号,不是连续索引
10、直接获取某一个值
dataframe[‘A’] [‘B’] #对应位置的值 直接使用行列索引名字的方式(先列后行)
最后
以上就是缓慢高跟鞋为你收集整理的DataFrame(3):DataFrame列的操作的全部内容,希望文章能够帮你解决DataFrame(3):DataFrame列的操作所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复