我是靠谱客的博主 虚幻电脑,最近开发中收集的这篇文章主要介绍Pandas 的这个知识点,估计 80% 的人都得挂!Pandas 的这个知识点,估计 80% 的人都得挂!,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

作者:Lemon

来源:Python数据之道


Pandas 的这个知识点,

估计 80% 的人都得挂!

大家好,我是 Lemon,今天来跟大家分享下 pandas 中 apply 函数的一个技巧。

Pandas 中 apply 函数,应用广泛,今天要跟大家分享一个使用的技巧,使用 apply 将 dataframe 中内容为 list 的列拆分为多列。

拆分前的数据情况,如下图红色标注所示:

拆分后,如下图所示:

这个案例中,Lemon 使用的数据来自 akshare ,在开始前,引入相关 package :

import pandas as pd
import akshare as ak

Lemon 使用的两个 Python 库的版本信息如下:

print(ak.__version__)
0.7.22
print(pd.__version__)
1.1.4

先从 akshare 获取需要的数据,分为两步,第一步是获取基金代码的列表,如下:

df = ak.fund_em_fund_name().head(20).tail(5)
df = df[['基金代码','基金简称']]
print(df)

第二步是获取基金净值数据和净值日期,通过一个自定义函数来获取,自定义函数如下:

# 获取基金单位净值以及净值日期
def get_mutual_fund(code):
    df = ak.fund_em_open_fund_info(fund=code, indicator="单位净值走势")
    df.columns = ['净值日期', '单位净值', 'equityReturn', 'unitMoney']
    df['净值日期'] = pd.to_datetime(df['净值日期'])
    df = df.sort_values('净值日期',ascending=False)
    unit_equity = df.head(1)['单位净值'].values[0]
    date_latest = df.head(1)['净值日期'].values[0]
    return [unit_equity, date_latest]

对于这个自定义函数,在 pandas 使用 apply 来应用自定义函数,这是使用 apply 的一种常用的方法,如下:

# 获取基金最新的单位净值和净值日期
df['tmp'] = df['基金代码'].apply(get_mutual_fund)
print(df)

获取的数据截图如下:

上图中的 tmp 列,就是我们这次需要进行处理的对象。

处理方法可以有多种,这里 Lemon 使用 pandas 中的 apply 来处理,相对来说,也是比较便捷的方式。

在 apply 函数中,使用 pd.Series 就可以达到我们的目的。

# 将单位净值和净值日期单独成列
df[['最新单位净值','净值日期']] = df['tmp'].apply(pd.Series)
df = df.drop('tmp',axis=1)
print(df)

结果如下:

看起来复杂的问题,解决起来也很便捷,是不是很容易啊,赶紧用起来吧。

---------End---------

 公众号后台回复「微信群」,将邀请加入读者交流群。

  • 《Python知识手册》

  • 《Matplotlib可视化指南》

  • 《Plotly可视化指南》

  • 《Pandas使用指南》

  • 《机器学习精选》

????分享、点赞、在看,给个三连击呗!???? 

最后

以上就是虚幻电脑为你收集整理的Pandas 的这个知识点,估计 80% 的人都得挂!Pandas 的这个知识点,估计 80% 的人都得挂!的全部内容,希望文章能够帮你解决Pandas 的这个知识点,估计 80% 的人都得挂!Pandas 的这个知识点,估计 80% 的人都得挂!所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部