有木有高手用过这个pdfbox
原因是需要对pdf进行提取文本操作,所以之前用了iTextSharp,但是原因是协议是AGPL,所以改用pdfbox,结果给出去以后测试直接就打回来了…提取谋篇文字版PDF的时候,提取了一堆
这种东西出来,没有正常的文字。
有没有高手用过pdfbox,看下这种问题出现的原因是什么,要怎么去解决呢

原因是需要对pdf进行提取文本操作,所以之前用了iTextSharp,但是原因是协议是AGPL,所以改用pdfbox,结果给出去以后测试直接就打回来了…提取谋篇文字版PDF的时候,提取了一堆


有没有高手用过pdfbox,看下这种问题出现的原因是什么,要怎么去解决呢

解决方案
30

30
快扔分,话说解决了没
40
本人觉得很可能问题出在pdf文档上,pdf跟xps一样,都有打印版和发布版,可以暂且不管这个问题,换个其他的pdf文档试试