概述
主要的代码:
df2_name = df1_name.drop_duplicates(subset=['username'], keep='first',inplace=False)
常用的参数就这三个:
- subset
根据哪个或者哪些字段进行去重
[‘a’] 对a列进行去重
[‘a’, ‘b’] 对 a与b的组合 进行去重 - keep {‘first’, ‘last’, False}
数据保留的原则
first
: 保留第一个last
: 保留最后一个False
: 只要是重复的都不要
- inplace {True, False}
在原本的dataframe上做修改还是复制一份后,对复制的数据进行修改
最后
以上就是无限狗为你收集整理的python dataframe去重的全部内容,希望文章能够帮你解决python dataframe去重所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复