Buenas tardes ¿Te refieres a leer el archivo del disco para que R trabaje sobre estos?
Esto dependerá del sistema operativo y la localización en la computadora. Hay un paquete pdftools, podría ser útil para su caso. Javier > El 25 nov 2024, a las 1:38 a. m., Javier Gómez Gonzalez <zaraga...@gmail.com> > escribió: > > Muy buenas: > > He encontrado el paquete textreuse y lo quiero utilizar para comparar dos > archivos pdf. > > Me ha sido imposible cargar los archivos para utilizar las funciones > TextReuseCorpus() o TextReuseTextDocument(). > > En la documentación del paquete los archivos los cargan desde > > ¿Alguien sabe cómo se hace? > > He conseguido calcular la similitud de jaccard utilizando este paquete, > pero para ello he empleado el siguiente código. > > library(pdftools) > > library(textreuse) > > text1 <- pdf_text("uno.pdf") > > text2 <- pdf_text("dos.pdf") > > full_text1 <- paste(text1, collapse = " ") > > full_text2 <- paste(text2, collapse = " ") > > a <- tokenize_words(full_text1) > > b <- tokenize_words(full_text2) > > jaccard_similarity(a, b) > > > Gracias > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es