我是靠谱客的博主 虚心导师,最近开发中收集的这篇文章主要介绍python的dataframe功能_python-无论长度如何,Pandas Dataframe上最干净的迭代/功能应用程序...,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

我一直在努力干净地迭代或将函数应用于可变长度的Pandas DataFrame.具体来说,长度为1的DataFrame slice(Pandas系列).

一个简单的例子,一个DataFrame和一个作用于它的每一行的函数.数据帧的格式是已知/预期的.

def stringify(row):

return "-".join([row["y"], str(row["x"]), str(row["z"])])

df = pd.DataFrame(dict(x=[1,2,3],y=["foo","bar","bro"],z=[-99,1.04,213]))

Out[600]:

x y z

0 1 foo -99.00

1 2 bar 1.04

2 3 bro 213.00

df_slice = df.iloc[0] # This is a Series

通常,您可以通过以下方式之一应用该功能:

stringy = df.apply(stringify,axis=1)

# or

stringy = [stringify(row) for _,row in df.iterrows()]

Out[611]: ['foo-1--99.0', 'bar-2-1.04', 'bro-3-213.0']

## Error with same syntax if Series

stringy = df_slice.apply(stringify, axis=1)

如果数据框为空或只有一个条目,则这些方法将不再起作用. Series没有iterrows()方法,而是Apply将函数应用于每一列(不是行).

是否有一种更清洁的内置方法来对函数进行迭代/将其应用于可变长度的DataFrame?否则,您必须不断编写繁琐的逻辑.

if type(df) is pd.DataFrame:

if len(df) == 0:

return None

else:

return df.apply(stringify, axis=1)

elif type(df) is pd.Series:

return stringify(df)

我意识到有一些方法可以确保您形成长度为1的数据帧,但是我要问的是一种干净的方法,可以在格式类似的数据帧或序列中对各种熊猫数据结构进行应用/迭代.

解决方法:

没有通用的方法可以编写一个可以同时处理两个函数的函数

DataFrames和Series.您要么需要使用if语句来检查

用于类型,或使用try..except处理异常.

我认为最好不要在调用apply之前创建正确类型的对象,而不是做任何事情.例如,不使用df.iloc [0]返回一个Series,而是使用df.iloc [:1]选择一个长度为1的DataFrame.只要将切片范围而不是单个值传递给df.iloc, ,您将获得一个DataFrame.

In [155]: df.iloc[0]

Out[155]:

x 1

y foo

z -99

Name: 0, dtype: object

In [156]: df.iloc[:1]

Out[156]:

x y z

0 1 foo -99

标签:pandas,apply,python

最后

以上就是虚心导师为你收集整理的python的dataframe功能_python-无论长度如何,Pandas Dataframe上最干净的迭代/功能应用程序...的全部内容,希望文章能够帮你解决python的dataframe功能_python-无论长度如何,Pandas Dataframe上最干净的迭代/功能应用程序...所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部