概述
处理重复数据
1.查找重复数据
import pandas as pd
list={'name':('liu','chen','liu','bonig'),
'sex':('m','f','m','m'),
'sc':('16','12','12','33')}
f=pd.DataFrame(list,columns=('name','sex','sc'))
f
name sex sc
0 liu m 16
1 chen f 12
2 liu m 12
3 bonig m 33
f.duplicated('name',keep='first')
.keep='first/last/False’:first:默认值,除了第一次出现外,其余相同的被标记为重复;last:除了最后一次出现外,其余相同的被标记为重复;False:即所有相同的都被标记为重复;
2.清除重复数据
f.drop_duplicates('name')
name sex sc
0 liu m 16
1 chen f 12
3 bonig m 33
最后
以上就是聪明御姐为你收集整理的特征工程与数据处理--处理重复数据duplicate函数处理重复数据的全部内容,希望文章能够帮你解决特征工程与数据处理--处理重复数据duplicate函数处理重复数据所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复