I am using solr 3.1 which I believe is using .8 apache Tika. I am
getting following error. Is it possible to fix this error?

org.apache.tika.exception.TikaException: Unexpected RuntimeException
from org.apache.tika.parser.pdf.PDFParser@2d8ed284
       at 
org.apache.solr.handler.extraction.ExtractingDocumentLoader.load(ExtractingDocumentLoader.java:217)
       at 
org.apache.solr.handler.ContentStreamHandlerBase.handleRequestBody(ContentStreamHandlerBase.java:55)
       at 
org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:129)
       at 
org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.handleRequest(RequestHandlers.java:238)
       at org.apache.solr.core.SolrCore.execute(SolrCore.java:1360)
       at 
org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:356)
       at 
org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:252)
       at 
org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1212)
       at 
org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:399)
       at 
org.mortbay.jetty.security.SecurityHandler.handle(SecurityHandler.java:216)
       at 
org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182)
       at 
org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:766)
       at org.mortbay.jetty.webapp.WebAppContext.handle(WebAppContext.java:450)
       at 
org.mortbay.jetty.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:230)
       at 
org.mortbay.jetty.handler.HandlerCollection.handle(HandlerCollection.java:114)
       at 
org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152)
       at org.mortbay.jetty.Server.handle(Server.java:326)
       at 
org.mortbay.jetty.HttpConnection.handleRequest(HttpConnection.java:542)
       at 
org.mortbay.jetty.HttpConnection$RequestHandler.content(HttpConnection.java:945)
       at org.mortbay.jetty.HttpParser.parseNext(HttpParser.java:756)
       at org.mortbay.jetty.HttpParser.parseAvailable(HttpParser.java:212)
       at org.mortbay.jetty.HttpConnection.handle(HttpConnection.java:404)
       at 
org.mortbay.jetty.bio.SocketConnector$Connection.run(SocketConnector.java:228)
       at 
org.mortbay.thread.QueuedThreadPool$PoolThread.run(QueuedThreadPool.java:582)
Caused by: org.apache.tika.exception.TikaException: Unexpected
RuntimeException from org.apache.tika.parser.pdf.PDFParser@2d8ed284
       at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:199)
       at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:197)
       at 
org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:137)
       at 
org.apache.solr.handler.extraction.ExtractingDocumentLoader.load(ExtractingDocumentLoader.java:196)
       ... 23 more
Caused by: java.lang.NumberFormatException: For input string: "0/NUL"
       at 
java.lang.NumberFormatException.forInputString(NumberFormatException.java:48)
       at java.lang.Integer.parseInt(Integer.java:458)
       at java.lang.Integer.parseInt(Integer.java:499)
       at 
org.apache.pdfbox.pdmodel.font.PDFont.getEncodingFromFont(PDFont.java:830)
       at 
org.apache.pdfbox.pdmodel.font.PDFont.determineEncoding(PDFont.java:293)
       at org.apache.pdfbox.pdmodel.font.PDFont.<init>(PDFont.java:178)
       at 
org.apache.pdfbox.pdmodel.font.PDSimpleFont.<init>(PDSimpleFont.java:79)
       at 
org.apache.pdfbox.pdmodel.font.PDType1Font.<init>(PDType1Font.java:139)
       at 
org.apache.pdfbox.pdmodel.font.PDFontFactory.createFont(PDFontFactory.java:109)
       at 
org.apache.pdfbox.pdmodel.font.PDFontFactory.createFont(PDFontFactory.java:76)
       at org.apache.pdfbox.pdmodel.PDResources.getFonts(PDResources.java:115)
       at 
org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:243)
       at 
org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:225)
       at 
org.apache.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:441)
       at 
org.apache.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:365)
       at 
org.apache.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:321)
       at 
org.apache.pdfbox.util.PDFTextStripper.getText(PDFTextStripper.java:241)
       at org.apache.tika.parser.pdf.PDF2XHTML.process(PDF2XHTML.java:53)
       at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:90)
       at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:197)
       ... 26 more

Reply via email to