PDF指定对象提取文本

.Net技术 码拜 9年前 (2016-03-04) 1698次浏览
有什么好的方法解决
提取PDF中指定区域中的全部对象的全部文本
或对区域内的某一个对象的文本
本人有N个PDF文件,每个PDF文件中的数据格式(排版方式)都是一样的
例如:
姓名:张三   年龄:10 性别:男


对上述文字进行假定的定义:
姓名:为object1  张三 object2 以此类推
那么需要做的就是 根据需要进行获取 例如上述 object1 中的值,或是object2 中的值,
找了下文本导出的功能的第三方库(pdfbox,itextsharp),但没发现可以对具体某个 object 进行提取
(本人做了个简单的提取全文本,通过一些规则分离文本字符,但对于提取来说还是不太方便)
解决方案

20

该回复于2016-06-20 15:03:15被管理员删除

CodeBye 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明PDF指定对象提取文本
喜欢 (0)
[1034331897@qq.com]
分享 (0)