概述
我有两个不同目录中的文件,其中包含索引文本的pickle列表,如下所示,以.out格式保存:
(lp0)
S'TCTCTTGGAGCACCACCTATTTCATATTCATTCATTCAGTATCCGCTGATCTTCGGACATGTTCA'
第一页
作为“TTCGGAcatagttcatatttatttgcccatacccgcgagagaagactcttgcagac”
第2页
作为“agagcctttgcagaccgtggca”
p3页
a
我试图完成的任务是打开可疑文本目录中的一个文件,并使用python的difflib将其与源文本目录中的每个文件进行比较,打印出一个数字,指示它们是否匹配,然后对可疑文本目录中的其余文件执行相同的操作。如果有人把两个耳朵的细节都比较清楚的话,那我就更清楚了
我目前的问题是for循环来完成这个任务,它不起作用。我的意思是我可以循环浏览这些文件夹,他们可以打印出文件夹的名称,但是文件本身的内容不会改变。循环目前只比较一个文件从每个目录多次,我不知道如何修复它。在
欢迎提出任何建议,如果我的解释足够清楚,请随时提出任何问题。在
谢谢。另外,我知道这是一个常见的问题,我已经尽我最大的努力去看看以前的答案,并应用他们所使用的,但我很难做到这一点,因为我不是很擅长编程。在
提前谢谢!在
F
代码如下:import string
import pickle
import sys
import glob
import difflib
sourcePath = 'C:UsersUserSou2/*.out'
suspectPath = 'C:UsersUserSusp2/*.out'
list_of_source_files = glob.glob(sourcePath)
list_of_suspect_files = glob.glob(suspectPath)
def get_source_files(list_of_source_files):
for source_file_name in list_of_source_files:
with open(source_file_name) as source_file:
sourceText = pickle.load(source_file)
return sourceText
get_suspect_files(list_of_suspect_files):
for suspect_file_name in list_of_suspect_files:
with open(suspect_file_name) as suspect_file:
suspectText = pickle.load(suspect_file)
return suspectText
def matching(sourceText,suspectText):
matching = difflib.SequenceMatcher(None,sourceText,suspectText)
print matching.ratio()
def main():
for suspectItem in list_of_suspect_files:
suspectText = get_suspect_files(list_of_suspect_files)
print ('----------------SEPERATOR-----------------')
for sourceItem in list_of_source_files:
sourceText = get_source_files(list_of_source_files)
matching(sourceText,suspectText)
main()
当前结果:
^{pr2}$
这应该是1.0的一些,因为我故意把匹配的索引文本的文本系统。在
最后
以上就是自觉老鼠为你收集整理的python中for循环遍历文件_Python for循环遍历目录文件的全部内容,希望文章能够帮你解决python中for循环遍历文件_Python for循环遍历目录文件所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复