RE: When Perth in Thika some of the characters in the body is continuous. Re: Apache Tikaで、PDFの本文内の文字が連続する現象発生

2016-09-15 Thread Allison, Timothy B.
: question.answer...@gmail.com [mailto:question.answer...@gmail.com] Sent: Wednesday, September 14, 2016 12:15 PM To: question.answer...@gmail.com Cc: user@tika.apache.org Subject: When Perth in Thika some of the characters in the body is continuous. Re: Apache Tikaで、PDFの本文内の文字が連続する現象発生 PDF is, in a

RE: Apache Tikaで、PDFの本文内の文字が連続する現象発生

2016-09-14 Thread Allison, Timothy B.
Again, relying on google translate. Y, I would think that suppressing overlapping characters should solve this problem. Try pure PDFBox, and if the problem is there, try asking on the PDFBox list. いきなりですが、表記件についてご質問させてください。 Javaで、Apache Tikaで、PDFのパース処理をしています。 ほとんどのPDFは、正常に、読み込めるのですが、パースエラーにな