概述
小福利,教你用Python读取文件夹下面的所有word文档
解决问题要换多种思路,多去寻找答案,也许你苦苦不能解决的问题,前面早就有大神帮你解决过了。
感谢前面探路的大神,对你们表示崇高的敬意。
import docx
from win32com import client as wc
import matplotlib.pyplot as plt
from collections import Counter
import os
path = r'D:\abc'
files_list = os.listdir(path)
print(files_list)
# 首先将doc转换成docx
# word = wc.Dispatch("Word.Application")
# 找到word路径 + 文件名 ,即可打开文件
# full_path = 'D:\abc\test.docx'
# doc = word.Documents.Open(full_path)
#
# # 使用参数16表示将doc转换成docx,保存成docx后才能 读文件
#
# doc.SaveAs(r"D:\abc\test2.docx",16)
# doc.Close()
# word.Quit()
for file_name in files_list:
# 判断文件类型是否在文件名中
if '.docx' in file_name:
path1="D:\abc\"+file_name
doc = docx.Document(path1)
parag_num = 0
for para in doc.paragraphs :
print(para.text)
parag_num += 1
print ('This document has ', parag_num, ' paragraphs')
感谢大神TensorSense和执检程序猿。
不要被某些人蒙蔽,要敢于自己去寻找答案,你自己动手找到的答案,才是真正能够帮你解决问题的答案。
读取结果如下
最后
以上就是自由胡萝卜为你收集整理的小福利,教你用Python读取文件夹下面的所有word文档的全部内容,希望文章能够帮你解决小福利,教你用Python读取文件夹下面的所有word文档所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复