概述
from collections import Counter
from itertools import chain
def count_key_value(corpus):
# word_freq 是个字典,key=词,value=词频
# Counter 是实现的 dict 的一个子类,可以用来方便地计数,统计词频
# chain函数来自于itertools库,itertools库提供了非常有用的基于迭代对象的函数,而chain函数则是可以串联多个迭代对象来形成一个更大的迭代对象
# *的作用:返回单个迭代器
word_freq = Counter(chain(*corpus))
return word_freq
if __name__ == "__main__":
corpus = [["今天", "是个", "好日子"],["今天", "是个", "坏日子"]]
for item in chain(*corpus):
print(item, end=' ')
print("/n")
print(count_key_value(corpus))
>>>今天 是个 好日子 今天 是个 坏日子 /n
>>>Counter({'今天': 2, '是个': 2, '好日子': 1, '坏日子': 1})
最后
以上就是从容发卡为你收集整理的Python快速实现词频计算的全部内容,希望文章能够帮你解决Python快速实现词频计算所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复