我是靠谱客的博主 聪明御姐,最近开发中收集的这篇文章主要介绍特征工程与数据处理--处理重复数据duplicate函数处理重复数据,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

处理重复数据

1.查找重复数据

import pandas as pd
list={'name':('liu','chen','liu','bonig'),
'sex':('m','f','m','m'),
'sc':('16','12','12','33')}
f=pd.DataFrame(list,columns=('name','sex','sc'))
f
    name	sex	sc
0	liu	    m	16
1	chen	f	12
2	liu	    m	12
3	bonig	m	33
f.duplicated('name',keep='first')

.keep='first/last/False’:first:默认值,除了第一次出现外,其余相同的被标记为重复;last:除了最后一次出现外,其余相同的被标记为重复;False:即所有相同的都被标记为重复;

2.清除重复数据

f.drop_duplicates('name')
name	sex	sc
0	liu	m	16
1	chen	f	12
3	bonig	m	33

最后

以上就是聪明御姐为你收集整理的特征工程与数据处理--处理重复数据duplicate函数处理重复数据的全部内容,希望文章能够帮你解决特征工程与数据处理--处理重复数据duplicate函数处理重复数据所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(83)

评论列表共有 0 条评论

立即
投稿
返回
顶部