特征工程与数据处理--处理重复数据duplicate函数处理重复数据

298 阅读 0 评论 197 点赞

我是靠谱客的博主聪明御姐，这篇文章主要介绍特征工程与数据处理--处理重复数据duplicate函数处理重复数据，现在分享给大家，希望可以做个参考。

处理重复数据

1.查找重复数据

import pandas as pd
list={'name':('liu','chen','liu','bonig'),
'sex':('m','f','m','m'),
'sc':('16','12','12','33')}
f=pd.DataFrame(list,columns=('name','sex','sc'))
f

    name	sex	sc
0	liu	    m	16
1	chen	f	12
2	liu	    m	12
3	bonig	m	33

f.duplicated('name',keep='first')

.keep='first/last/False’：first：默认值，除了第一次出现外，其余相同的被标记为重复；last：除了最后一次出现外，其余相同的被标记为重复；False：即所有相同的都被标记为重复；

2.清除重复数据

f.drop_duplicates('name')

name	sex	sc
0	liu	m	16
1	chen	f	12
3	bonig	m	33

最后

以上就是聪明御姐最近收集整理的关于特征工程与数据处理--处理重复数据duplicate函数处理重复数据的全部内容，更多相关特征工程与数据处理--处理重复数据duplicate函数处理重复数据内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：python
浏览次数：298 次浏览
发布日期：2023-10-19 00:20:18

sklearn中的决策树模块及流程

python完全重复数据去重_python找出数据中的重复数据

pandas使用drop_duplicates函数基于指定单个字段删除dataframe数据中单个数据列包含重复数据的数据行（keep参数为False删除所有重复行、不做保留）pandas使用drop_duplicates函数基于指定单个字段删除dataframe数据中单个数据列包含重复数据的数据行（设置subset参数、删除指定数据列内容重复的数据行、keep参数为False删除所有重复行、不做保留）

特征工程与数据处理--处理重复数据duplicate函数处理重复数据

处理重复数据

1.查找重复数据

2.清除重复数据

最后

评论列表共有 0 条评论

发表评论取消回复

特征工程与数据处理--处理重复数据duplicate函数处理重复数据

处理重复数据

1.查找重复数据

2.清除重复数据

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复