我是靠谱客的博主 典雅手链,最近开发中收集的这篇文章主要介绍python去重复行_Python 中使用 pandas Dataframe 删除重复的行,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
Python 中使用 pandas Dataframe 删除重复的行 :
1、(可选)可以使用 duplicated( )函数判断 是否有重复项
df.duplicated( )
输出的是 布尔值 FALSE 、TRUE
2、有重复项,则可以用drop_duplicates()移除重复项
3、如上的1和2 中的duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列。
也可以对特定的列进行重复项判断,在括号中添加列名就可以了。如:
data_df_extractedReviews =pd.DataFrame({'userID': user_id_list,'productID': product_id_list,'overall': overall_list,#'feature': feature_list,
#'opinion': opinion_list
'feature_opinion_sentiment_pair':feature_opinion_sentiment_pair
})#这样得到的 df 是含有重复 item的行的,而实际上item只有一个。所以,
data_df_extractedReviews=data_df_extractedReviews.drop_dupli
最后
以上就是典雅手链为你收集整理的python去重复行_Python 中使用 pandas Dataframe 删除重复的行的全部内容,希望文章能够帮你解决python去重复行_Python 中使用 pandas Dataframe 删除重复的行所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复