C# 使用pdfbox提取文本提取了一堆控制字符

.Net技术 码拜 9年前 (2016-03-11) 976次浏览
有木有高手用过这个pdfboxC# 使用pdfbox提取文本提取了一堆控制字符
原因是需要对pdf进行提取文本操作,所以之前用了iTextSharp,但是原因是协议是AGPL,所以改用pdfbox,结果给出去以后测试直接就打回来了…提取谋篇文字版PDF的时候,提取了一堆C# 使用pdfbox提取文本提取了一堆控制字符C# 使用pdfbox提取文本提取了一堆控制字符这种东西出来,没有正常的文字。
有没有高手用过pdfbox,看下这种问题出现的原因是什么,要怎么去解决呢C# 使用pdfbox提取文本提取了一堆控制字符
解决方案

30

C# 使用pdfbox提取文本提取了一堆控制字符

30

快扔分,话说解决了没

40

本人觉得很可能问题出在pdf文档上,pdf跟xps一样,都有打印版和发布版,可以暂且不管这个问题,换个其他的pdf文档试试

CodeBye 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明C# 使用pdfbox提取文本提取了一堆控制字符
喜欢 (0)
[1034331897@qq.com]
分享 (0)