Re: [R] Newbie - Scrape Data From PDFs?

2018-01-23 Thread Ulrik Stervbo
I think I would use pdftk to extract the form data. All subsequent manipulation in R. HTH Ulrik Eric Berger schrieb am Mi., 24. Jan. 2018, 08:11: > Hi Scott, > I have never done this myself but I read something recently on the > r-help distribution that was related. > I

[R] Function gutenberg_download in the gutenbergr package

2018-01-23 Thread Patrick Connolly
I've been working through https://www.tidytextmining.com/tidytext.html wherein everything worked until I got to this part in section 1.5 > hgwells <- gutenberg_download(c(35, 36, 5230, 159)) Determining mirror for Project Gutenberg from http://www.gutenberg.org/robot/harvest Error in

Re: [R] Newbie - Scrape Data From PDFs?

2018-01-23 Thread Eric Berger
Hi Scott, I have never done this myself but I read something recently on the r-help distribution that was related. I just did a quick search and found a few hits that might work for you. 1. https://medium.com/@CharlesBordet/how-to-extract-and-clean-data-from-pdf-files-in-r-da11964e252e 2.

[R] Newbie - Scrape Data From PDFs?

2018-01-23 Thread Scott Clausen
Hello, I’m new to R and am using it with RStudio to learn the language. I’m doing so as I have quite a lot of traffic data I would like to explore. My problem is that all the data is located on a number of PDFs. Can someone point me to info on gathering data from other sources? I’ve been to

Re: [R-es] ejecución de script si un archivo es colocado en un directorio

2018-01-23 Thread Javier Marcuzzi
Estimado Patricio Se puede divider el problema en dos. En primer lugar se encuentra la forma de colocar el archivo en el directorio, es decir con un simple copia y pega o como respuesta a un programa o servicio web donde hay una parte lógica que recibe y escribe. La segunda parte del problema

Re: [R-es] ejecución de script si un archivo es colocado en un directorio

2018-01-23 Thread Freddy Omar López Quintero
Hola. El mar, 23-01-2018 a las 19:44 -0500, patricio fuenmayor escribió: > He pensado ejecutar el llamado del script por intervalos de tiempo y > validar si el archivo se encuentra en el directorio y ejecutarlo Aunque yo no lo he usado, creo que esta utilidad: https://github.com/ar-/incron

[R-es] ejecución de script si un archivo es colocado en un directorio

2018-01-23 Thread patricio fuenmayor
Hola a todos. Tengo una duda y recurro a ustedes para que me den una idea. Debo desarrollar un proceso que requiere la ejecución de un script de R, mismo que debe ejecutarse si y solo si un archivo es colocado en un directorio específico. Tienen alguna idea de como hacerlo ... ? Yo no se a que

Re: [R] Scraping from different level URLs website

2018-01-23 Thread Jeff Newmiller
They seem to release their data in xml and csv formats also... why are you scraping? -- Sent from my phone. Please excuse my brevity. On January 23, 2018 9:31:01 AM PST, Ilio Fornasero wrote: >I am doing a research on World Bank (WB) projects on developing

Re: [R-es] Sobre paquete slam.-

2018-01-23 Thread Freddy Omar López Quintero
¡A diferencia de la mayoría de las veces, encontré la respuesta pronto! A los que les suceda lo mismo (y posiblemente para mí mismo en el futuro), mirar las versiones de gcc y de gfortran: [ec2-user@ip ~]$ gcc --version gcc (GCC) 7.2.1 20170915 (Red Hat 7.2.1-2) Copyright (C) 2017 Free Software

[R-es] Sobre paquete slam.-

2018-01-23 Thread Freddy Omar López Quintero
¡Hola! Espero que estén bien. Estoy intentando instalar el paquete slam en la variante de Centos de amazon y obtengo el siguiente problema: gcc -m64 -std=gnu99 -shared -L/usr/lib64/R/lib -L/usr/local/lib64 -o slam.so apply.o dll.o grouped.o sparse.o util.o -L/usr/lib64/R/lib -lRblas -lgfortran

[R] Scraping from different level URLs website

2018-01-23 Thread Ilio Fornasero
I am doing a research on World Bank (WB) projects on developing countries. To do so, I am scraping their website in order to collect the data I am interested in. The structure of the webpage I want to scrape is the following: 1. List of countries the list of all countries in which WB has

Re: [R-es] Streaming data en R

2018-01-23 Thread Carlos Ortega
Hola, Bueno, puedes hacértelo tú mismo con un Sys.sleep() dentro de un bucle o algo así y que vaya ejecutándose una función de lectura de datos y procesado cada cierto tiempo... Saludos, Carlos Ortega. www.qualityexcellence.es El 23 de enero de 2018, 15:39, Jesús Para Fernández <

Re: [R-es] Streaming data en R

2018-01-23 Thread Javier Marcuzzi
Estimado Jesús Para Fernández Entonces posiblemente no es streaming, el planteo puede ser más simple con rvest, curl, o alguna otra forma. El aparato que genera los datos los guarda cada 4 minutos en un lugar de la web, por ejemplo los archivos se llaman medición_1.csv, medición_2.csv,

Re: [R-es] Streaming data en R

2018-01-23 Thread Jesús Para Fernández
Gracias, pero eso hace streaming de twitter Lo que quiero es lo siguiente: Tengo un aparato que genera cada 4minutos una medicion y lo guarda en csv. Entonces queiro que ese dato lo vaya leyendo R de manera automatica. He visto la libreria cronR, pero me gustaria saber si hay algo mas...

[R] interaction term by a factor group in gamm4

2018-01-23 Thread Maria Lathouri via R-help
Dear all, I am writing as I would really need your help on the problem with gamm4. I have tried to find a solution online but I wasn't very successful. I am running a gamm4 model with an interaction between two variable using the tensor term, t2. I have a group variable (super end group) with

Re: [R] substr gives empty output

2018-01-23 Thread Luigi Marongiu
Thank you, I got it, now it works good On Mon, Jan 22, 2018 at 1:58 PM, Howard, Tim G (DEC) wrote: > In > > y <- substr(x, i, 1) > > your third integer needs to be the location not the number of digits, so > change it to > > y <- substr(x, i, i) > > and you should get