pandas使用drop_duplicates去除DataFrame重复项参数详解
DataFrame中存在重复的行或者几行中某几列的值重复,这时候需要去掉重复行,示例如下:data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)代码中subset对应的值是列名,表示只考虑这两列,将这两列对应值相同的行进行去重。默认值为subset=None表示考虑所有列。keep='first'表示保留第一次出现的重复行,是默认值。keep另外两个取值为"last"和False,分别表示保留最后一次出