我是靠谱客的博主 自由胡萝卜,最近开发中收集的这篇文章主要介绍小福利,教你用Python读取文件夹下面的所有word文档,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

小福利,教你用Python读取文件夹下面的所有word文档
解决问题要换多种思路,多去寻找答案,也许你苦苦不能解决的问题,前面早就有大神帮你解决过了。
感谢前面探路的大神,对你们表示崇高的敬意。

import docx
from win32com import client as wc
import matplotlib.pyplot as plt
from collections import Counter
import os


path = r'D:\abc'
files_list = os.listdir(path)
print(files_list)

# 首先将doc转换成docx
# word = wc.Dispatch("Word.Application")

# 找到word路径 + 文件名 ,即可打开文件
# full_path = 'D:\abc\test.docx'
# doc = word.Documents.Open(full_path)
#
# # 使用参数16表示将doc转换成docx,保存成docx后才能 读文件
#
# doc.SaveAs(r"D:\abc\test2.docx",16)
# doc.Close()
# word.Quit()

for file_name in files_list:
    # 判断文件类型是否在文件名中
    if '.docx' in file_name:
        path1="D:\abc\"+file_name


        doc = docx.Document(path1)
        parag_num = 0
        for para in doc.paragraphs :
            print(para.text)
            parag_num += 1
        print ('This document has ', parag_num, ' paragraphs')

感谢大神TensorSense和执检程序猿。
不要被某些人蒙蔽,要敢于自己去寻找答案,你自己动手找到的答案,才是真正能够帮你解决问题的答案。

读取结果如下
在这里插入图片描述

最后

以上就是自由胡萝卜为你收集整理的小福利,教你用Python读取文件夹下面的所有word文档的全部内容,希望文章能够帮你解决小福利,教你用Python读取文件夹下面的所有word文档所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(28)

评论列表共有 0 条评论

立即
投稿
返回
顶部