概述
题目:英文字符频率统计。编写一个程序,对给定的字符串中出现的A~Z字母频率分析,忽略大小写,采用降序方式输出。
方法一:
代码:
#把每个元素后面都加一个空格
with open('11.txt', 'r+') as filehandler:
with open('22.txt','w') as filehandler2:
filehandler2.write(''.join([f+' ' for fh in filehandler for f in fh]))
#把大写变为小写
def times():
txt = open("22.txt","r").read()
txt = txt.lower()
for ch in ',,。.::’—!':
txt = txt.replace(ch," ") #将文本中特殊文字符替换为空格
return txt
total = times()
letters = total.split()
counts = {}
for letter in letters:
counts[letter] = counts.get(letter,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse = True)
for i in range(20):
letter,count = items[i]
print("{0:<20}{1:>5}".format(letter,count))
方法二:
代码如下:
def processLine(line, CharacterCounts):
for character in line:
if ord(character) in range(97, 123): #ord()函数主要用来返回对应字符的ascii码
CharacterCounts[character] += 1
#创建字母字典
def createCharacterCounts(CharacterCounts):
for i in range(97, 123):
CharacterCounts[chr(i)] = 0
def main():
#用户输入一个文件名
# filename = input("enter a filename:").strip()
filename = "11.txt"
infile = open(filename, "r")
#建立用于计算词频的空字典
CharacterCounts = {}
#初始化字典键值
createCharacterCounts(CharacterCounts)
for line in infile:
processLine(line.lower(), CharacterCounts)
#从字典中获取数据对
pairs = list(CharacterCounts.items())
#列表中的数据对交换位置,数据对排序
items = [[x,y] for (y,x) in pairs]
items.sort(reverse=True)
#输出count个数词频结果
for i in range(len(items)):
print(items[i][1]+"t"+str(items[i][0]))
infile.close()
#调用main()函数
if __name__ == '__main__':
main()
最后
以上就是神勇寒风为你收集整理的英文字符频率统计 python实现的全部内容,希望文章能够帮你解决英文字符频率统计 python实现所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复