Muchas gracias Carlos.

Manuel

El 2 de octubre de 2017, 1:42, Carlos Ortega <[email protected]>
escribió:

> Hola,
>
> Hay una adaptación específica a R de una solución comercial, pero que se
> puede usar hasta cierto número de llamdas: pdftools
>
> https://cloud.r-project.org/web/packages/pdftools/index.html
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 2 de octubre de 2017, 9:22, Isidro Hidalgo Arellano <[email protected]>
> escribió:
>
>> Yo he utilizado "tm" para tratar PDF de forma masiva, pero hay que tener
>> mucho cuidado con los PDF, porque lo que aparentemente es homogéneo
>> (visualmente ves todos los documentos igual), resulta que no lo es, y te
>> encuentras "saltos" de página, códigos de cabeceras de tabla, etc.
>> Colocados
>> de forma diferente según el ejemplar de PDF.
>> Si quieres algo que no falle, tendrás que trabajarlo bastante para no
>> dejar
>> margen de error (contemplando toda la casuística que puedas encontrar por
>> el
>> camino). En fin, perdona el rollo...
>> Suerte.
>>
>>
>> Isidro Hidalgo Arellano
>> Observatorio del Mercado de Trabajo
>> Consejería de Economía, Empresas y Empleo
>> http://www.castillalamancha.es/
>>
>>
>>
>> -----Mensaje original-----
>> De: R-help-es [mailto:[email protected]] En nombre de
>> Manuel
>> Spínola
>> Enviado el: viernes, 29 de septiembre de 2017 16:47
>> Para: R <[email protected]>
>> Asunto: [R-es] Minería de testo en R
>>
>> Estimados miembros del grupo,
>>
>> Estoy buscando paquetes de R que permitan hacer minería de textos de
>> archivos PDF o Word que tengan una estructura tabular (cuadros) de
>> resultado
>> de talleres de trabajo donde se tratan diferentes ejes temáticos.
>>
>> Especifico esto porque he visto que algunos paquetes analizan directamente
>> texto de libros, tweets u otras fuentes donde no hay una estructura como
>> cuadros en el texto que se quiere analizar.
>>
>> Desde ya muchas gracias por la ayuda.
>>
>> Saludos,
>>
>> Manuel
>>
>> --
>> *Manuel Spínola, Ph.D.*
>> Instituto Internacional en Conservación y Manejo de Vida Silvestre
>> Universidad Nacional Apartado 1350-3000 Heredia COSTA RICA
>> [email protected]
>> <[email protected]> [email protected]
>> Teléfono: (506) 8706 - 4662
>> Personal website: Lobito de río <https://sites.google.com/site
>> /lobitoderio/>
>> Institutional website: ICOMVIS <http://www.icomvis.una.ac.cr/>
>>
>>         [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> [email protected]
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>> _______________________________________________
>> R-help-es mailing list
>> [email protected]
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
*Manuel Spínola, Ph.D.*
Instituto Internacional en Conservación y Manejo de Vida Silvestre
Universidad Nacional
Apartado 1350-3000
Heredia
COSTA RICA
[email protected] <[email protected]>
[email protected]
Teléfono: (506) 8706 - 4662
Personal website: Lobito de río <https://sites.google.com/site/lobitoderio/>
Institutional website: ICOMVIS <http://www.icomvis.una.ac.cr/>

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a