我是靠谱客的博主 从容发卡,最近开发中收集的这篇文章主要介绍Python快速实现词频计算,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

from collections import Counter
from itertools import chain
def count_key_value(corpus):
    # word_freq 是个字典,key=词,value=词频
    # Counter 是实现的 dict 的一个子类,可以用来方便地计数,统计词频
    # chain函数来自于itertools库,itertools库提供了非常有用的基于迭代对象的函数,而chain函数则是可以串联多个迭代对象来形成一个更大的迭代对象
        # *的作用:返回单个迭代器
    word_freq = Counter(chain(*corpus))
    return word_freq

if __name__ == "__main__":
    corpus = [["今天", "是个", "好日子"],["今天", "是个", "坏日子"]]
    for item in chain(*corpus):
        print(item, end='  ')
    print("/n")
    print(count_key_value(corpus))

>>>今天  是个  好日子  今天  是个  坏日子  /n
>>>Counter({'今天': 2, '是个': 2, '好日子': 1, '坏日子': 1})

最后

以上就是从容发卡为你收集整理的Python快速实现词频计算的全部内容,希望文章能够帮你解决Python快速实现词频计算所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(44)

评论列表共有 0 条评论

立即
投稿
返回
顶部