首先将数据导入并创建DataFrame对象,修改列名,并查看前10项数据是否正确

通过duplicated函数将相同项筛选出来并创建一个Series对象保存结果。然后输入Series对象中的10项

合并DataFrame对象Series对象,将series对象加入到same列并通过same列的值索引出相同的项

转载于:https://www.cnblogs.com/SilenceS-S-F/p/7530872.html
最后
以上就是踏实蓝天最近收集整理的关于pandas库的使用---对50w的数据进行处理的全部内容,更多相关pandas库内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复