长情鸭子

文章
6
资源
2
加入时间
3年2月3天

python dataframe去重_Python Dataframe 指定多列去重、求差集的方法

1)去重指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数据进行去重。Attention:主要用到了drop_duplicates方法,并设置参数subset为多个字段名构成的数组。具体代码如下:>>>import pandas as pd>>>data={'state':[1,1,2,2,1,2,2],'pop':...