我是靠谱客的博主 明亮嚓茶,最近开发中收集的这篇文章主要介绍pandas中Series的map apply方法、DataFrame的apply applymap方法、groupby方法1 Series的map apply方法2、DataFrame的apply applymap方法3、groupby方法,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

1 Series的map apply方法

#数据
boolean=[True,False]
gender=["男","女"]
color=["white","black","yellow"]
data=pd.DataFrame({
"height":np.random.randint(150,190,100),
"weight":np.random.randint(40,90,100),
"smoker":[boolean[x] for x in np.random.randint(0,2,100)],
"gender":[gender[x] for x in np.random.randint(0,2,100)],
"age":np.random.randint(15,90,100),
"color":[color[x] for x in np.random.randint(0,len(color),100) ]
}
)
#1、map:①使用字典进行映射
data["gender"] = data["gender"].map({"男":1, "女":0})
#2、map:②使用函数
def gender_map(x):
gender = 1 if x == "男" else 0
return gender
#注意这里传入的是函数名,不带括号
data["gender"] = data["gender"].map(gender_map)
#3、apply:
def apply_age(x,bias):
return x+bias
#以元组的方式传入额外的参数
data["age"] = data["age"].apply(apply_age,args=(-3,))

2、DataFrame的apply applymap方法

#1、apply: 按照列求和
data[["height","weight","age"]].apply(np.sum, axis=0)
# 按照列取对数
data[["height","weight","age"]].apply(np.log, axis=0)
#2、apply:自定义函数
def BMI(series):
weight = series["weight"]
height = series["height"]/100
BMI = weight/height**2
return BMI
data["BMI"] = data.apply(BMI,axis=1)
#3、applymap:单元格
df = pd.DataFrame(
{
"A":np.random.randn(5),
"B":np.random.randn(5),
"C":np.random.randn(5),
"D":np.random.randn(5),
"E":np.random.randn(5),
}
)
df.applymap(lambda x:"%.2f" % x)

3、groupby方法

company=["A","B","C"]
data=pd.DataFrame({
"company":[company[x] for x in np.random.randint(0,len(company),10)],
"salary":np.random.randint(5,50,10),
"age":np.random.randint(15,50,10)
}
)
#1 聚合操作
#是groupby后非常常见的操作,会写SQL的朋友对此应该是非常熟悉了。聚合操作可以用来求和、均值、最大值、最小值等
#max min sum mean median std(标准差) var(方差) count(计数)
(1)对所有列求平均值
data.groupby("company").agg('mean')
(2)对不同列求不同类型值
data.groupby('company').agg({'salary':'median','age':'mean'})
(3)对某列求不同类型值
whs = data.groupby('门类')['计划数'].agg(['sum','max','min','mean','count'])
#2 分类汇总后的apply应用(每个公司年龄最大的员工)
def get_oldest_staff(x):
df = x.sort_values(by = 'age',ascending=True)
return df.iloc[-1,:]
oldest_staff = data.groupby('company',as_index=False).apply(get_oldest_staff)
#3 分类汇总后的transform应用(添加列:员工所在的公司的平均薪水)
#方法1:生成公司平均薪水的字典,然后map查找
avg_salary_dict = data.groupby('company')['salary'].mean().to_dict()
data['avg_salary'] = data['company'].map(avg_salary_dict)
#方法2:将公司所有员工的工资转换成平均值
data['avg_salary'] = data.groupby('company')['salary'].transform('mean')

最后

以上就是明亮嚓茶为你收集整理的pandas中Series的map apply方法、DataFrame的apply applymap方法、groupby方法1 Series的map apply方法2、DataFrame的apply applymap方法3、groupby方法的全部内容,希望文章能够帮你解决pandas中Series的map apply方法、DataFrame的apply applymap方法、groupby方法1 Series的map apply方法2、DataFrame的apply applymap方法3、groupby方法所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(36)

评论列表共有 0 条评论

立即
投稿
返回
顶部