Re: [Python-es] Extraer texto de un pdf

2016-04-13 Por tema Kiko
El 13 de abril de 2016, 13:46, Javier Sangalo 
escribió:

> Siento molestaros de nuevo, pero hay algunos pdfs que cuando hago 
> *extractText()
> *lo que obtengo es un conjunto de lineas en blanco, y no logro saber
> porqué.
> Con otros pdf funciona sin problema, pero con este por ejemplo (
> http://boe.es/boe_n/dias/2016/04/13/not.php?id=BOE-N-2016-199370 ) solo
> obtengo lineas en blanco
>
> Quizás sea por algo relacionado con la codificación del pdf, pero no
> encuentro ninguna opción para cambiar la codificación.
>

Puedes poner código con lo que estás intentando y pdf's donde te suceda
para que se pueda reproducir el comportamiento?


>
> Muchas gracias de antemano.
>
> Un saludo.
>
> El 13 de abril de 2016, 9:32, Javier Sangalo 
> escribió:
>
>> Muchisimas gracias a todos!!
>> Funciona sin problema!!
>>
>> El 12 de abril de 2016, 16:21, Robert  escribió:
>>
>>> Hola javier, otro ejemplo de uso PyPDF2
>>> :
>>>
>>> http://stackoverflow.com/questions/18755412/parse-a-pdf-using-python
>>>
>>> Saludos.
>>>
>>> --
>>> Roberto Beroiza Alvear
>>>  Linux User # 533916
>>>   Chile
>>>
>>> 2016-04-11 11:17 GMT-03:00 Javier Sangalo :
>>>
 Buenas tardes,

 Estoy intentando extraer información de un pdf y trato de instalarme
 algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
 instalación.
 Estoy usando anaconda en windows y según he leido, algunas de estas
 librerías no son compatibles con windows.
 Alguien sabríadecirme si existe alguna librería similar que pueda
 instalar en windows?

 Muchas gracias de antemano.

 ___
 Python-es mailing list
 Python-es@python.org
 https://mail.python.org/mailman/listinfo/python-es
 FAQ: http://python-es-faq.wikidot.com/


>>>
>>>
>>>
>>> ___
>>> Python-es mailing list
>>> Python-es@python.org
>>> https://mail.python.org/mailman/listinfo/python-es
>>> FAQ: http://python-es-faq.wikidot.com/
>>>
>>>
>>
>
> ___
> Python-es mailing list
> Python-es@python.org
> https://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


Re: [Python-es] Extraer texto de un pdf

2016-04-13 Por tema Javier Sangalo
Siento molestaros de nuevo, pero hay algunos pdfs que cuando hago
*extractText()
*lo que obtengo es un conjunto de lineas en blanco, y no logro saber porqué.
Con otros pdf funciona sin problema, pero con este por ejemplo (
http://boe.es/boe_n/dias/2016/04/13/not.php?id=BOE-N-2016-199370 ) solo
obtengo lineas en blanco

Quizás sea por algo relacionado con la codificación del pdf, pero no
encuentro ninguna opción para cambiar la codificación.

Muchas gracias de antemano.

Un saludo.

El 13 de abril de 2016, 9:32, Javier Sangalo  escribió:

> Muchisimas gracias a todos!!
> Funciona sin problema!!
>
> El 12 de abril de 2016, 16:21, Robert  escribió:
>
>> Hola javier, otro ejemplo de uso PyPDF2
>> :
>>
>> http://stackoverflow.com/questions/18755412/parse-a-pdf-using-python
>>
>> Saludos.
>>
>> --
>> Roberto Beroiza Alvear
>>  Linux User # 533916
>>   Chile
>>
>> 2016-04-11 11:17 GMT-03:00 Javier Sangalo :
>>
>>> Buenas tardes,
>>>
>>> Estoy intentando extraer información de un pdf y trato de instalarme
>>> algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
>>> instalación.
>>> Estoy usando anaconda en windows y según he leido, algunas de estas
>>> librerías no son compatibles con windows.
>>> Alguien sabríadecirme si existe alguna librería similar que pueda
>>> instalar en windows?
>>>
>>> Muchas gracias de antemano.
>>>
>>> ___
>>> Python-es mailing list
>>> Python-es@python.org
>>> https://mail.python.org/mailman/listinfo/python-es
>>> FAQ: http://python-es-faq.wikidot.com/
>>>
>>>
>>
>>
>>
>> ___
>> Python-es mailing list
>> Python-es@python.org
>> https://mail.python.org/mailman/listinfo/python-es
>> FAQ: http://python-es-faq.wikidot.com/
>>
>>
>
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


Re: [Python-es] Extraer texto de un pdf

2016-04-13 Por tema Javier Sangalo
Muchisimas gracias a todos!!
Funciona sin problema!!

El 12 de abril de 2016, 16:21, Robert  escribió:

> Hola javier, otro ejemplo de uso PyPDF2
> :
>
> http://stackoverflow.com/questions/18755412/parse-a-pdf-using-python
>
> Saludos.
>
> --
> Roberto Beroiza Alvear
>  Linux User # 533916
>   Chile
>
> 2016-04-11 11:17 GMT-03:00 Javier Sangalo :
>
>> Buenas tardes,
>>
>> Estoy intentando extraer información de un pdf y trato de instalarme
>> algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
>> instalación.
>> Estoy usando anaconda en windows y según he leido, algunas de estas
>> librerías no son compatibles con windows.
>> Alguien sabríadecirme si existe alguna librería similar que pueda
>> instalar en windows?
>>
>> Muchas gracias de antemano.
>>
>> ___
>> Python-es mailing list
>> Python-es@python.org
>> https://mail.python.org/mailman/listinfo/python-es
>> FAQ: http://python-es-faq.wikidot.com/
>>
>>
>
>
>
> ___
> Python-es mailing list
> Python-es@python.org
> https://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


Re: [Python-es] Extraer texto de un pdf

2016-04-12 Por tema Robert
Hola javier, otro ejemplo de uso PyPDF2 
:

http://stackoverflow.com/questions/18755412/parse-a-pdf-using-python

Saludos.

-- 
Roberto Beroiza Alvear
 Linux User # 533916
  Chile

2016-04-11 11:17 GMT-03:00 Javier Sangalo :

> Buenas tardes,
>
> Estoy intentando extraer información de un pdf y trato de instalarme
> algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
> instalación.
> Estoy usando anaconda en windows y según he leido, algunas de estas
> librerías no son compatibles con windows.
> Alguien sabríadecirme si existe alguna librería similar que pueda instalar
> en windows?
>
> Muchas gracias de antemano.
>
> ___
> Python-es mailing list
> Python-es@python.org
> https://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


Re: [Python-es] Extraer texto de un pdf

2016-04-12 Por tema Kiko
El 11 de abril de 2016, 16:17, Javier Sangalo 
escribió:

> Buenas tardes,
>
> Estoy intentando extraer información de un pdf y trato de instalarme
> algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
> instalación.
> Estoy usando anaconda en windows y según he leido, algunas de estas
> librerías no son compatibles con windows.
> Alguien sabríadecirme si existe alguna librería similar que pueda instalar
> en windows?
>

Prueba con PyPDF2.

Yo lo he instalado sin problemas en windows.

Ejemplos de uso aquí:
https://automatetheboringstuff.com/chapter13/


>
> Muchas gracias de antemano.
>
> ___
> Python-es mailing list
> Python-es@python.org
> https://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


[Python-es] Extraer texto de un pdf

2016-04-12 Por tema Javier Sangalo
Buenas tardes,

Estoy intentando extraer información de un pdf y trato de instalarme
algunas librerías como pdf2text o pdfMiner pero no consiguo completar la
instalación.
Estoy usando anaconda en windows y según he leido, algunas de estas
librerías no son compatibles con windows.
Alguien sabríadecirme si existe alguna librería similar que pueda instalar
en windows?

Muchas gracias de antemano.
___
Python-es mailing list
Python-es@python.org
https://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/