我是靠谱客的博主 羞涩含羞草,最近开发中收集的这篇文章主要介绍提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

1. 示例代码

示例代码中详细介绍了如何读取word中的标题大纲。



import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;

import java.io.FileInputStream;
import java.util.List;

public class App1 {

    public static void main(String[] args) throws Exception {

        FileInputStream inputStream = new FileInputStream("demo2.docx");
        XWPFDocument doc = new XWPFDocument(inputStream);

        //获取所有段落
        List<XWPFParagraph> list = doc.getParagraphs();
        for (XWPFParagraph paragraph : list) {
            int titleLevel = WordUtils.getTitleLevel(doc, paragraph);
            // System.out.println("titleLevel = " + titleLevel);
            switch (titleLevel) {
                case 1:
                    System.out.println("<h1>" + paragraph.getText() + "</h1>");
                    break;
                case 2:
                    System.out.println("<h2>" + paragraph.getText() + "</h2>");
                    break;
                case 3:
                    System.out.println("<h3>" + paragraph.getText() + "</h3>");
                    break;
                // todo
                case 4:
                case 5:
                case 6:
                case 7:
                default:
                    // 当成正文处理
                    System.out.println("<p>" + paragraph.getText() + "</p>");
            }
        }

        inputStream.close();
    }


}


import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;


public class WordUtils {

    private WordUtils() {
        // nop
    }


    /**
     * Word中的大纲级别,可以通过getPPr().getOutlineLvl()直接提取,
     * 但需要注意,Word中段落级别,通过如下三种方式定义:
     * 1、直接对段落进行定义;
     * 2、对段落的样式进行定义;
     * 3、对段落样式的基础样式进行定义。
     * 因此,在通过“getPPr().getOutlineLvl()”提取时,需要依次在如上三处读取。
     *
     * @param doc
     * @param para
     * @return 返回级别数字,1代表一级标题,2代表二级标题,0代表正文
     */
    public static int getTitleLevel(XWPFDocument doc, XWPFParagraph para) {
        try {
            //判断该段落是否设置了大纲级别
            if (para.getCTP().getPPr().getOutlineLvl() != null) {
                return para.getCTP().getPPr().getOutlineLvl().getVal().intValue() + 1;
            }
        } catch (Exception e) {
            // nop
        }
        try {
            //判断该段落的样式是否设置了大纲级别
            if (doc.getStyles().getStyle(para.getStyle()).getCTStyle().getPPr().getOutlineLvl() != null) {
                return doc.getStyles().getStyle(para.getStyle()).getCTStyle().getPPr().getOutlineLvl()
                        .getVal().intValue() + 1;
            }
        } catch (Exception e) {
            // nop
        }
        try {
            //判断该段落的样式的基础样式是否设置了大纲级别
            if (doc.getStyles().getStyle(doc.getStyles().getStyle(para.getStyle()).getCTStyle().getBasedOn().getVal())
                    .getCTStyle().getPPr().getOutlineLvl() != null) {
                String styleName = doc.getStyles().getStyle(para.getStyle()).getCTStyle().getBasedOn().getVal();
                return doc.getStyles().getStyle(styleName).getCTStyle().getPPr()
                        .getOutlineLvl().getVal().intValue() + 1;
            }
        } catch (Exception e) {
            // nop
        }
        return 0;
    }
}

2. 待读取的word文档

内容如下:

在这里插入图片描述

3. 读取大纲后输出的html内容

在这里插入图片描述

将这些内容放到1.html文件中,然后用浏览器打开,效果如下:

在这里插入图片描述

最后

以上就是羞涩含羞草为你收集整理的提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:的全部内容,希望文章能够帮你解决提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(84)

评论列表共有 0 条评论

立即
投稿
返回
顶部