我是靠谱客的博主 炙热宝贝,最近开发中收集的这篇文章主要介绍Dataframe取差集你记牢了吗?,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

哇,时间好快一个多月没更新文章了,在这一个月里发生了很多事也是没有太多时间。不过我胡汉三又回来了,哈哈,,,

废话不多说,今天我要记录一个很容易用到的知识点。就是取两个dataframe的差集,遇到这个情况我第一个想到的是循环遍历,然它一一匹配,但是慢慢我觉得小数据的速度还行,但是数据量大了以后可能会比较繁琐。不停扒网页我发现的确有简单方法:

df1 = DataFrame([['a', 10, '男'], ['b', 11, '男'], ['c', 11, '女'], ['a', 10, '女'], ['c', 11, '男']], 
columns=['name', 'age', 'sex']) 

df2 = DataFrame([['a', 10, '男'], 
                 ['b', 11, '女']],
                columns=['name', 'age', 'sex'])

取交集:print(pd.merge(df1,df2,on=['name', 'age', 'sex']))

取并集:print(pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer'))

取差集(从df1中过滤df1在df2中存在的行):

df1 = df1.append(df2)
df1 = df1.append(df2)
df1 = df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False)
print(df1)

参考:https://blog.csdn.net/qq_40981268/article/details/85957177

最后

以上就是炙热宝贝为你收集整理的Dataframe取差集你记牢了吗?的全部内容,希望文章能够帮你解决Dataframe取差集你记牢了吗?所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部