处理重复数据
1.查找重复数据
import pandas as pd
list={'name':('liu','chen','liu','bonig'),
'sex':('m','f','m','m'),
'sc':('16','12','12','33')}
f=pd.DataFrame(list,columns=('name','sex','sc'))
f
name sex sc
0 liu m 16
1 chen f 12
2 liu m 12
3 bonig m 33
f.duplicated('name',keep='first')
.keep='first/last/False’:first:默认值,除了第一次出现外,其余相同的被标记为重复;last:除了最后一次出现外,其余相同的被标记为重复;False:即所有相同的都被标记为重复;
2.清除重复数据
f.drop_duplicates('name')
name sex sc
0 liu m 16
1 chen f 12
3 bonig m 33
最后
以上就是聪明御姐最近收集整理的关于特征工程与数据处理--处理重复数据duplicate函数处理重复数据的全部内容,更多相关特征工程与数据处理--处理重复数据duplicate函数处理重复数据内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复