我是靠谱客的博主 落寞草莓,最近开发中收集的这篇文章主要介绍【教程】PDF开发工具Spire.PDF 教程:使用C#从PDF中的特定矩形区域中提取文本,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Spire.PDF 是一个专业的PDF组件,能够独立地创建、编写、编辑、操作和阅读PDF文件,支持 .NET、WPF和Silverlight三个版本,本文介绍了如何通过Spire.PDF使用C#从PDF中的特定矩形区域中提取文本。

使用Spire.PDF,程序员可以从PDF文档中的特定矩形区域提取文本,本文演示如何使用Spire.PDF和C#实现此功能。

示例文件:

图片1

详细步骤:

Step 1: 初始化PdfDocument类的对象并加载PDF文件。

PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile("Stories.pdf");

Step 2: 获取第一页。

PdfPageBase page = pdf.Pages[0];

Step 3: 从页面中的特定矩形区域中提取文本,之后将文本保存为.txt文件。

string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());

输出:

图片2

完整代码:

//Initialize an object of PdfDocument class
PdfDocument pdf = new PdfDocument();
//Load the PDF file
pdf.LoadFromFile("Stories.pdf");
//Get the first page
PdfPageBase page = pdf.Pages[0];
// Extract text from a specific rectangular area within the page
string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );
//Save the text to a .txt file
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());


最后

以上就是落寞草莓为你收集整理的【教程】PDF开发工具Spire.PDF 教程:使用C#从PDF中的特定矩形区域中提取文本的全部内容,希望文章能够帮你解决【教程】PDF开发工具Spire.PDF 教程:使用C#从PDF中的特定矩形区域中提取文本所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(34)

评论列表共有 0 条评论

立即
投稿
返回
顶部