[jira] [Commented] (PDFBOX-2445) Out of Memory - Extract text for Apache_Solr_4.7_Ref_Guide.pdf

Michael Goddard (JIRA) Wed, 22 Oct 2014 06:17:32 -0700

    [ 
https://issues.apache.org/jira/browse/PDFBOX-2445?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=14179878#comment-14179878
 ]


Michael Goddard commented on PDFBOX-2445:
-----------------------------------------

BTW, here's my app's stack trace:

java.lang.OutOfMemoryError: Java heap space
        at java.util.AbstractCollection.toArray(AbstractCollection.java:136)
        at java.util.ArrayList.<init>(ArrayList.java:164)
        at org.apache.pdfbox.cos.COSDocument.getObjects(COSDocument.java:532)
        at org.apache.pdfbox.cos.COSDocument.close(COSDocument.java:589)
        at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:258)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1235)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1200)
        at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:126)
        at 
org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:244)
        at 
org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:244)
        at 
org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:121)
        ...


> Out of Memory - Extract text for Apache_Solr_4.7_Ref_Guide.pdf
> --------------------------------------------------------------
>
>                 Key: PDFBOX-2445
>                 URL: https://issues.apache.org/jira/browse/PDFBOX-2445
>             Project: PDFBox
>          Issue Type: Bug
>          Components: Parsing, PDModel
>    Affects Versions: 1.8.7, 2.0.0
>            Reporter: Maruan Sahyoun
>




--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (PDFBOX-2445) Out of Memory - Extract text for Apache_Solr_4.7_Ref_Guide.pdf

Reply via email to