我是靠谱客的博主 典雅手链,最近开发中收集的这篇文章主要介绍python去重复行_Python 中使用 pandas Dataframe 删除重复的行,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Python 中使用 pandas Dataframe 删除重复的行 :

818082-20200329180325128-1184830859.png

1、(可选)可以使用 duplicated( )函数判断 是否有重复项

df.duplicated( )

输出的是 布尔值 FALSE 、TRUE

2、有重复项,则可以用drop_duplicates()移除重复项

3、如上的1和2 中的duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列。

也可以对特定的列进行重复项判断,在括号中添加列名就可以了。如:

data_df_extractedReviews =pd.DataFrame({'userID': user_id_list,'productID': product_id_list,'overall': overall_list,#'feature': feature_list,

#'opinion': opinion_list

'feature_opinion_sentiment_pair':feature_opinion_sentiment_pair

})#这样得到的 df 是含有重复 item的行的,而实际上item只有一个。所以,

data_df_extractedReviews=data_df_extractedReviews.drop_dupli

最后

以上就是典雅手链为你收集整理的python去重复行_Python 中使用 pandas Dataframe 删除重复的行的全部内容,希望文章能够帮你解决python去重复行_Python 中使用 pandas Dataframe 删除重复的行所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(71)

评论列表共有 0 条评论

立即
投稿
返回
顶部