我是靠谱客的博主 漂亮柠檬,最近开发中收集的这篇文章主要介绍pandas分组之后对相同group内的字段进行合并背景实施,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

更多、更及时内容欢迎留意微信公众号小窗幽记机器学习

背景

在pandas中对数据进行分组后,想要对相同组的数据进行其他字段的合并。类似场景:有2个字段,分别是文本内容和标签值。先根据文本内容进行分组,再对同一个组内的标签值进行合并,从而得到多标签值。

实施

测试:


import pandas as pd
df = pd.DataFrame({'text': ['华中科技大学', '武汉大学', '清华大学', '华中科技大学', '武汉大学'],
'label': ["985,理工", "985", "北京", "武汉", "武汉"]})
print("初始df:")
print(df)
new_df = df.groupby(['text'])
new_df = new_df['label'].apply(lambda x: ",".join(list(set(x.str.cat(sep=',').split(','))))).reset_index()
print("同组text,合并label之后的df:")
print(new_df)

输出结果:

初始df:
text
label
0
华中科技大学
985,理工
1
武汉大学
985
2
清华大学
北京
3
华中科技大学
武汉
4
武汉大学
武汉
同组text,合并label之后的df:
text
label
0
华中科技大学
武汉,985,理工
1
武汉大学
武汉,985
2
清华大学
北京

【更多、更及时内容欢迎留意微信公众号小窗幽记机器学习

最后

以上就是漂亮柠檬为你收集整理的pandas分组之后对相同group内的字段进行合并背景实施的全部内容,希望文章能够帮你解决pandas分组之后对相同group内的字段进行合并背景实施所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部