我是靠谱客的博主 甜蜜犀牛,最近开发中收集的这篇文章主要介绍python学习问题总结之集合操作、列表操作速度快慢,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

前几天做了一个任务,有一个2700万行的关键词txt文档,关键词之间用%隔开,要求将每行关键词分隔开,并将整个txt文档里的所有词进行一个去重,最后将结果输出到一个新的txt文档里,每个关键词占一行。

任务并不难,我很快就编好了代码,输出的部分就不说了,主要讲输入已经操作的过程,具体代码如下:

a = set()
i = 0
with open('中文期刊关键词.txt', 'r', encoding='utf-8') as f:
    for line in f:
        b = set(line.strip().split('%'))
        a = a | b
        i += 1
        print('已进行到第' + str(i) + '行')

因为要对结果进行去重,因此想到了python中的集合,众所周知,集合内不存在重复的元素,故我先设置一个总的集合a,然后读取文件,然后对每一行关键词进行分割,将其改成集合,再与大集合进行并集操作,这样进行完2700万行之后,我将获得一个没有重复关键词的大集合。


理想很丰满,现实很骨感,我看着控制台不断打印已进行到XX行,一股成就感油然而生,然后五分钟过去了,十分钟过去了,为什么还在跑啊大哥,结果发现,才跑到十多万行,我心里有句MMP不知当讲不当讲,这跑完要30多个小时啊,领导那边还着急要呢有

最后

以上就是甜蜜犀牛为你收集整理的python学习问题总结之集合操作、列表操作速度快慢的全部内容,希望文章能够帮你解决python学习问题总结之集合操作、列表操作速度快慢所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部