我是靠谱客的博主 羞涩含羞草,最近开发中收集的这篇文章主要介绍提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
1. 示例代码
示例代码中详细介绍了如何读取word中的标题大纲。
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import java.io.FileInputStream;
import java.util.List;
public class App1 {
public static void main(String[] args) throws Exception {
FileInputStream inputStream = new FileInputStream("demo2.docx");
XWPFDocument doc = new XWPFDocument(inputStream);
//获取所有段落
List<XWPFParagraph> list = doc.getParagraphs();
for (XWPFParagraph paragraph : list) {
int titleLevel = WordUtils.getTitleLevel(doc, paragraph);
// System.out.println("titleLevel = " + titleLevel);
switch (titleLevel) {
case 1:
System.out.println("<h1>" + paragraph.getText() + "</h1>");
break;
case 2:
System.out.println("<h2>" + paragraph.getText() + "</h2>");
break;
case 3:
System.out.println("<h3>" + paragraph.getText() + "</h3>");
break;
// todo
case 4:
case 5:
case 6:
case 7:
default:
// 当成正文处理
System.out.println("<p>" + paragraph.getText() + "</p>");
}
}
inputStream.close();
}
}
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
public class WordUtils {
private WordUtils() {
// nop
}
/**
* Word中的大纲级别,可以通过getPPr().getOutlineLvl()直接提取,
* 但需要注意,Word中段落级别,通过如下三种方式定义:
* 1、直接对段落进行定义;
* 2、对段落的样式进行定义;
* 3、对段落样式的基础样式进行定义。
* 因此,在通过“getPPr().getOutlineLvl()”提取时,需要依次在如上三处读取。
*
* @param doc
* @param para
* @return 返回级别数字,1代表一级标题,2代表二级标题,0代表正文
*/
public static int getTitleLevel(XWPFDocument doc, XWPFParagraph para) {
try {
//判断该段落是否设置了大纲级别
if (para.getCTP().getPPr().getOutlineLvl() != null) {
return para.getCTP().getPPr().getOutlineLvl().getVal().intValue() + 1;
}
} catch (Exception e) {
// nop
}
try {
//判断该段落的样式是否设置了大纲级别
if (doc.getStyles().getStyle(para.getStyle()).getCTStyle().getPPr().getOutlineLvl() != null) {
return doc.getStyles().getStyle(para.getStyle()).getCTStyle().getPPr().getOutlineLvl()
.getVal().intValue() + 1;
}
} catch (Exception e) {
// nop
}
try {
//判断该段落的样式的基础样式是否设置了大纲级别
if (doc.getStyles().getStyle(doc.getStyles().getStyle(para.getStyle()).getCTStyle().getBasedOn().getVal())
.getCTStyle().getPPr().getOutlineLvl() != null) {
String styleName = doc.getStyles().getStyle(para.getStyle()).getCTStyle().getBasedOn().getVal();
return doc.getStyles().getStyle(styleName).getCTStyle().getPPr()
.getOutlineLvl().getVal().intValue() + 1;
}
} catch (Exception e) {
// nop
}
return 0;
}
}
2. 待读取的word文档
内容如下:
3. 读取大纲后输出的html内容
将这些内容放到1.html文件中,然后用浏览器打开,效果如下:
最后
以上就是羞涩含羞草为你收集整理的提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:的全部内容,希望文章能够帮你解决提取word中的标题大纲1. 示例代码2. 待读取的word文档3. 读取大纲后输出的html内容将这些内容放到1.html文件中,然后用浏览器打开,效果如下:所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复