我是靠谱客的博主 优秀战斗机,最近开发中收集的这篇文章主要介绍python统计文章单词次数_Python实现的统计文章单词次数功能示例,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:

题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:

#coding=utf-8

import collections

import re

import os

useless_words=('the','a','an','and','by','of','in','on','is','to')

def get_important_word(file):

f=open(file)

word_counter=collections.Counter()

for line in f:

words=re.findall('w+',line.lower())

word_counter.update(words)

f.close()

most_important_word=word_counter.most_common(1)[0][0]

count=2

while(most_important_word in useless_words):

most_important_word=word_counter.most_common(count)[

最后

以上就是优秀战斗机为你收集整理的python统计文章单词次数_Python实现的统计文章单词次数功能示例的全部内容,希望文章能够帮你解决python统计文章单词次数_Python实现的统计文章单词次数功能示例所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部