我是靠谱客的博主 聪明御姐,这篇文章主要介绍特征工程与数据处理--处理重复数据duplicate函数处理重复数据,现在分享给大家,希望可以做个参考。

处理重复数据

1.查找重复数据

import pandas as pd
list={'name':('liu','chen','liu','bonig'),
'sex':('m','f','m','m'),
'sc':('16','12','12','33')}
f=pd.DataFrame(list,columns=('name','sex','sc'))
f
    name	sex	sc
0	liu	    m	16
1	chen	f	12
2	liu	    m	12
3	bonig	m	33
f.duplicated('name',keep='first')

.keep='first/last/False’:first:默认值,除了第一次出现外,其余相同的被标记为重复;last:除了最后一次出现外,其余相同的被标记为重复;False:即所有相同的都被标记为重复;

2.清除重复数据

f.drop_duplicates('name')
name	sex	sc
0	liu	m	16
1	chen	f	12
3	bonig	m	33

最后

以上就是聪明御姐最近收集整理的关于特征工程与数据处理--处理重复数据duplicate函数处理重复数据的全部内容,更多相关特征工程与数据处理--处理重复数据duplicate函数处理重复数据内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(118)

评论列表共有 0 条评论

立即
投稿
返回
顶部