Re: [R-es] ayuda sobre grafico de barras simple

2023-06-01 Por tema Javier Marcuzzi
Hola

¿Cuidado?  Es una pesadilla entrar en esos xml, es una genialidad colocar xml 
dentro de una carpeta zip, si alguien no lo sabe, tomen cualquier archivo de 
excel, le cambian la extensión a zip, descomprimen, y pueden ver el contenido. 
Este contenido se puede recorrer y acomodarlo en forma tal que facilite el 
trabajo posterior en R o en otro lenguaje.

Pero claro, se pueden insertar muchas cosas dentro de esa carpeta zip que tiene 
otra extensión, docx, xlsx, etc.

Siempre es más fácil desde una base de datos o exportar a un csv, pero cuándo 
recibes archivos xlsx y estos pueden cambiar, hay que recorrerlos, horrible, 
pero hay que automatizar un poco o estar todo el día y archivo por archivo.

Desde el punto de vista de R, creo que solo tiene importancia reconocer los 
String, Numeric, Boolean, como problema, la fecha y hora es Numeric al igual 
que un número decimal, ahí hay que toquetear un poco para pasarlo correctamente 
a R, pero bueno, coincido en que es algo de mucho cuidado, que puede tener 
cosas extras, y si se puede no entrar en ese campo minado, mejor, es horrible.

Javier Rubén Marcuzzi 

> El 1 jun. 2023, a las 11:18, Ps. Félix Pérez V.  
> escribió:
> 
> El 31-05-23 a las 17:56, Javier Marcuzzi escribió:
>> Estimados
>> 
>> José envio un archivo, pero no es privativo.  Hay varios programas para 
>> abrir un documento word, pero, dicho de otra forma, es docx, especificado en:
>> 
>> https://es.wikipedia.org/wiki/Office_Open_XML
>> 
>> Bajo esas especificaciones es posible crear reportes escritos con extensión 
>> docx, o pdf, la diferencia es que uno es creado por Microsoft y otro por 
>> Adobe.
>> 
>> Yo se utilizar lo especificado y código libre para recorrer datos en 
>> archivos de excel, incluso hay dos formas de realizar la lectura, lo 
>> importante de este es que al recorrer el archivo ya todo decisiones en forma 
>> automática para continuar con el trabajo posterior de datos. Es un rompe 
>> cabezas, pero da algunos beneficios.
>> 
> Buenas!!!
> 
> Pero se debe usar con cuidado el formato en cuestión:
> 
> "Compatibilidad
> A día de hoy Microsoft Office sigue sin soportar el formato OOXML establecido 
> por el estándar ISO/IEC 29500 por defecto.13​ Aunque aparentemente se puede 
> seleccionar manualmente que guarde los documentos en dicho formato a partir 
> de Microsoft Office 2013,23​ la configuración de Microsoft Office provoca 
> incompatibilidades e imposibilidad de intercambiar documentos en OOXML de 
> forma ágil. Hay múltiples versiones distintas del estándar (ECMA, ISO, por 
> cada versión de Microsoft Office), pudiéndose implementar en teoría solamente 
> una versión (la «Strict») por agentes externos a Microsoft. En la práctica, 
> la versión «Strict» del estándar sin extensiones no la utiliza nadie ya que 
> Microsoft usa su implementación con extensiones propias.13​ Esto es 
> problemático puesto que la implementación «Strict» de Microsoft y sus 
> extensiones no están documentadas, no son abiertas, se pueden cambiar sin 
> previo aviso y tienen el potencial de crecer en número indefinidamente. La 
> especificación «Markup Compatibility and Extensibility» (MCE, partes 5 y 3 
> del estándar ECMA e ISO, respectivamente) permite respetar el estándar, 
> incluido el «Strict» aunque se introduzcan etiquetas adicionales, sean 
> propietarias o no. Las extensiones de Microsoft son propietarias. La forma de 
> ser compatible con las extensiones si no son soportadas por el programa 
> consiste en ignorar esos contenidos o degradarlos, ocasionando pérdida de 
> información.13​24​ Se puede interpretar como un caso de Adoptar, Extender y 
> Extinguir, presentando una filosofía cuyo objetivo es operar sólo con 
> entornos Microsoft sin tener en cuenta el resto de suites ofimáticas.15​ "
> 
> Del mismo enlace citado.
> 
> Saludos.
> 
> 
> 
>> 
>>> El 31 may. 2023, a las 16:34, Proyecto R-UCA  
>>>  escribió:
>>> 
>>> Buenas, José:
>>> 
>>> En una lista de software libre es preferible no usar formatos privativos de 
>>> archivos como los que utiliza Microsoft.
>>> 
>>> Las instrucciones siguientes hacen un gráfico de barras:
>>> x <- rbinom(10, 20, .3)
>>> barplot(table(x))
>>> 
>>> ¿Los valores no se corresponden con una variable cuantitativa discreta? En 
>>> caso contrario no es ese el gráfico que debe usarse.
>>> 
>>> Un saludo.
>>> 
>>> 
>>> -- 
>>> --
>>> http://knuth.uca.es/R
>>> --
>>> Proyecto R-UCA
>>> --
>>> Nombre: Manuel Muñoz Márquez
>>> Departamento: Departamento de Estadística e Investigación Operativa
>>> Institución: Escuela Superior de Ingeniería
>>> Organización: Universidad de Cádiz
>>> --
>>> 
>>> 
>>> El mié, 31-05-2023 a las 14:55 -0400, Jose Betancourt Bethencourt escribió:
 Estimados
 
 mi pregunta viene en archivo adjunto
 

Re: [R-es] ayuda sobre grafico de barras simple

2023-06-01 Por tema Ps . Félix Pérez V .

El 31-05-23 a las 17:56, Javier Marcuzzi escribió:

Estimados

José envio un archivo, pero no es privativo.  Hay varios programas 
para abrir un documento word, pero, dicho de otra forma, es docx, 
especificado en:


Office Open XML - Wikipedia, la enciclopedia libre 


es.wikipedia.org 
wikipedia.png 



Bajo esas especificaciones es posible crear reportes escritos con 
extensión docx, o pdf, la diferencia es que uno es creado por 
Microsoft y otro por Adobe.


Yo se utilizar lo especificado y código libre para recorrer datos en 
archivos de excel, incluso hay dos formas de realizar la lectura, lo 
importante de este es que al recorrer el archivo ya todo decisiones en 
forma automática para continuar con el trabajo posterior de datos. Es 
un rompe cabezas, pero da algunos beneficios.



Buenas!!!

Pero se debe usar con cuidado el formato en cuestión:

"Compatibilidad
A día de hoy Microsoft Office sigue sin soportar el formato OOXML 
establecido por el estándar ISO/IEC 29500 por defecto.13​ Aunque 
aparentemente se puede seleccionar manualmente que guarde los documentos 
en dicho formato a partir de Microsoft Office 2013,23​ la configuración 
de Microsoft Office provoca incompatibilidades e imposibilidad de 
intercambiar documentos en OOXML de forma ágil. Hay múltiples versiones 
distintas del estándar (ECMA, ISO, por cada versión de Microsoft 
Office), pudiéndose implementar en teoría solamente una versión (la 
«Strict») por agentes externos a Microsoft. En la práctica, la versión 
«Strict» del estándar sin extensiones no la utiliza nadie ya que 
Microsoft usa su implementación con extensiones propias.13​ Esto es 
problemático puesto que la implementación «Strict» de Microsoft y sus 
extensiones no están documentadas, no son abiertas, se pueden cambiar 
sin previo aviso y tienen el potencial de crecer en número 
indefinidamente. La especificación «Markup Compatibility and 
Extensibility» (MCE, partes 5 y 3 del estándar ECMA e ISO, 
respectivamente) permite respetar el estándar, incluido el «Strict» 
aunque se introduzcan etiquetas adicionales, sean propietarias o no. Las 
extensiones de Microsoft son propietarias. La forma de ser compatible 
con las extensiones si no son soportadas por el programa consiste en 
ignorar esos contenidos o degradarlos, ocasionando pérdida de 
información.13​24​ Se puede interpretar como un caso de Adoptar, 
Extender y Extinguir, presentando una filosofía cuyo objetivo es operar 
sólo con entornos Microsoft sin tener en cuenta el resto de suites 
ofimáticas.15​ "


Del mismo enlace citado.

Saludos.





El 31 may. 2023, a las 16:34, Proyecto R-UCA  escribió:

Buenas, José:

En una lista de software libre es preferible no usar formatos 
privativos de archivos como los que utiliza Microsoft.


Las instrucciones siguientes hacen un gráfico de barras:
x <- rbinom(10, 20, .3)
barplot(table(x))

¿Los valores no se corresponden con una variable cuantitativa 
discreta? En caso contrario no es ese el gráfico que debe usarse.


Un saludo.


--
--
http://knuth.uca.es/R
--
Proyecto R-UCA
--
Nombre: Manuel Muñoz Márquez
Departamento: Departamento de Estadística e Investigación Operativa
Institución: Escuela Superior de Ingeniería
Organización: Universidad de Cádiz
--


El mié, 31-05-2023 a las 14:55 -0400, Jose Betancourt Bethencourt 
escribió:

Estimados

mi pregunta viene en archivo adjunto

saludos
José
___
R-help-es mailing list
R-help-es@r-project.org
https://urldefense.com/v3/__https://stat.ethz.ch/mailman/listinfo/r-help-es__;!!D9dNQwwGXtA!XqMLNpizJGItFNcLlVaD1vaSzng5UjUXgQR3uDGGDDb4RrDrXvhBziOOcA8knGBgnxvH4O3aOZNQmnU$



___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


--
Ps. Félix Pérez Villoria
Centro Kumon & Ayudantía Pedagógica.
https://www.ayudantiapedagogica.cl
General Ordóñez 30 oficina 11B-12B, Maipú, Santiago, Chile
Móvil: 56 9 9672 2896
Móvil: 56 9 6213 2492
Oficina: 56 2 2893 4345
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda sobre grafico de barras simple

2023-05-31 Por tema Jose Betancourt Bethencourt
Gracias!!

El 31/5/23, Javier Marcuzzi  escribió:
> Estimados
>
> José envio un archivo, pero no es privativo.  Hay varios programas para
> abrir un documento word, pero, dicho de otra forma, es docx, especificado
> en:
>
> https://es.wikipedia.org/wiki/Office_Open_XML
>
> Bajo esas especificaciones es posible crear reportes escritos con extensión
> docx, o pdf, la diferencia es que uno es creado por Microsoft y otro por
> Adobe.
>
> Yo se utilizar lo especificado y código libre para recorrer datos en
> archivos de excel, incluso hay dos formas de realizar la lectura, lo
> importante de este es que al recorrer el archivo ya todo decisiones en forma
> automática para continuar con el trabajo posterior de datos. Es un rompe
> cabezas, pero da algunos beneficios.
>
> Javier Rubén Marcuzzi
>
>
>> El 31 may. 2023, a las 16:34, Proyecto R-UCA  escribió:
>>
>> Buenas, José:
>>
>> En una lista de software libre es preferible no usar formatos privativos
>> de archivos como los que utiliza Microsoft.
>>
>> Las instrucciones siguientes hacen un gráfico de barras:
>> x <- rbinom(10, 20, .3)
>> barplot(table(x))
>>
>> ¿Los valores no se corresponden con una variable cuantitativa discreta? En
>> caso contrario no es ese el gráfico que debe usarse.
>>
>> Un saludo.
>>
>>
>> --
>> --
>> http://knuth.uca.es/R
>> --
>> Proyecto R-UCA
>> --
>> Nombre: Manuel Muñoz Márquez
>> Departamento: Departamento de Estadística e Investigación Operativa
>> Institución: Escuela Superior de Ingeniería
>> Organización: Universidad de Cádiz
>> --
>>
>>
>> El mié, 31-05-2023 a las 14:55 -0400, Jose Betancourt Bethencourt
>> escribió:
>>> Estimados
>>>
>>> mi pregunta viene en archivo adjunto
>>>
>>> saludos
>>> José
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://urldefense.com/v3/__https://stat.ethz.ch/mailman/listinfo/r-help-es__;!!D9dNQwwGXtA!XqMLNpizJGItFNcLlVaD1vaSzng5UjUXgQR3uDGGDDb4RrDrXvhBziOOcA8knGBgnxvH4O3aOZNQmnU$
>>>
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Dr. Jose A. Betancourt Bethencourt
Universidad de Ciencias Medicas Carlos j. Finlay

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda sobre grafico de barras simple

2023-05-31 Por tema Proyecto R-UCA
Buenas, José:

En una lista de software libre es preferible no usar formatos privativos de 
archivos como los que utiliza Microsoft.

Las instrucciones siguientes hacen un gráfico de barras:
x <- rbinom(10, 20, .3)
barplot(table(x))

¿Los valores no se corresponden con una variable cuantitativa discreta? En caso 
contrario no es ese el gráfico que debe usarse.

Un saludo.


-- 
--
http://knuth.uca.es/R
--
Proyecto R-UCA
--
Nombre: Manuel Muñoz Márquez
Departamento: Departamento de Estadística e Investigación Operativa
Institución: Escuela Superior de Ingeniería
Organización: Universidad de Cádiz
--


El mié, 31-05-2023 a las 14:55 -0400, Jose Betancourt Bethencourt escribió:
> Estimados
> 
> mi pregunta viene en archivo adjunto
> 
> saludos
> José
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://urldefense.com/v3/__https://stat.ethz.ch/mailman/listinfo/r-help-es__;!!D9dNQwwGXtA!XqMLNpizJGItFNcLlVaD1vaSzng5UjUXgQR3uDGGDDb4RrDrXvhBziOOcA8knGBgnxvH4O3aOZNQmnU$
>  

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con Función nueva variable

2022-07-06 Por tema Javier Marcuzzi
Perdón, este es el código


n1 <-c(974.0, 938.1, 908.9, 884.3, 862.6, 843.2, 825.4)
alfa <-c(0.2642, 0.3754, 0.5014, 0.6273, 0.7380, 0.8250, 0.8875)
datos <- data.frame(n1,alfa)
datos
#creo indice
indices <- as.numeric(rownames(datos))
datos <- data.frame(indices, datos)
datos

valor <-1025
valorCalculado <- c()
for (i in datos$indices) {
  if(i == 1)
  {
n1 <- datos[datos$indice == i, 2]
alpha <- datos[datos$indice == i, 3]
valor <- valor-(valor-n1)^alpha
valorCalculado <-c(valor)
  }
  else
  {
   # indicesn1   alfa=> 23
n1 <- datos[datos$indice == i, 2]
alpha <- datos[datos$indice == i, 3]

valor <- valor-(valor-n1)^alpha
valorCalculado <- c(valorCalculado, valor)
  }
}

datos <- data.frame(datos, valorCalculado)
datos

> El 6 jul. 2022, a las 10:31, Álvaro Hernández Vicente  
> escribió:
> 
> Hola, Andrés:
> 
> Con la mezcla que has hecho de variables de distintos ejemplos no se 
> entiende mucho lo que necesitas. Si la fórmula que tienes en tu excel es 
> exactamente lo que quieres replicar en R, entonces puedes hacerlo con
> 
> dd <- tibble::tribble(~N1,  ~alfa,  ~NN, NA, 
> NA,  1025, 974, 0.2642, 1022.2, 
> 938.1, 0.3754, 1016.9, 
> 908.9, 0.5014, 1006.4, 884.3, 0.6273,  986.1, 
> 862.6,  0.738,  951.1, 
> 843.2,  0.825,  903.5, 825.4, 0.8875,  855.7) 
> dd$nn_new <- 1025 for(i in 2:nrow(dd)){ dd$nn_new[i] <- (dd$nn_new[i - 
> 1] - (dd$nn_new[i - 1] - dd$N1[i])^dd$alfa[i]) }
> 
> Un saludo,
> Álvaro
> 
> 
> On 7/6/22 14:39, Andrés Hirigoyen wrote:
>> Hola Javier y Carlos, adjunto un ejemplo en excel para explicarme 
>> mejor, sigo sin conseguir el objetivo.
>> Carlos, el valor inicial se lo doy como input.
>> Saludos!
>> 
>> El mar, 5 jul 2022 a la(s) 17:16, Carlos Ortega 
>> (c...@qualityexcellence.es) escribió:
>> 
>> Hola,
>> 
>> Bueno, puedes combinar varios lags en la nueva variable...
>> 
>>> library(dplyr)
>>> myiris <- iris
>>> alfa <- 1.7
>>> expo <- 0.263
>>> myiris %>%
>> + mutate( mynewSL = lag(Sepal.Length) * 2) %>%
>> + mutate( *mynewSLcompleja* =
>> lag(Sepal.Length)*(lag(Sepal.Length)-alfa)^expo) %>%
>> + relocate( mynewSL, .before = Sepal.Width) %>%
>> + relocate( mynewSLcompleja, .before = mynewSL) %>%
>> + head()
>> Sepal.Length *mynewSLcompleja *mynewSL Sepal.Width Petal.Length
>> Petal.Width Species
>> 1 *5.1 * NA NA 3.5 1.4 
>> 0.2 setosa
>> 2 4.9 7.036378 10.2 3.0 1.4 
>> 0.2 setosa
>> 3 4.7 6.653506 9.8 3.2 1.3 
>> 0.2 setosa
>> 4 4.6 6.274523 9.4 3.1 1.5 
>> 0.2 setosa
>> 5 5.0 6.086512 9.2 3.6 1.4 
>> 0.2 setosa
>> 6 5.4 6.844460 10.0 3.9 1.7 
>> 0.4 setosa
>> 
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es  
>> >
>> 
>> El mar, 5 jul 2022 a las 22:07, Andrés Hirigoyen
>> (mailto:andreshirigo...@gmail.com>>) escribió:
>> 
>> Gracias Carlos.
>> Siguiendo tu ejemplo, en mi nueva variable el valor de la
>> observación 2 (*10.2*) es el valor que entra para calcular el
>> valor de la observación 3 (*4.7 y 10.2*)
>> 
>> NNn+1=10.2*(10.2-4.7)^0.263
>> Saludos
>> 
>> El mar, 5 jul 2022 a la(s) 16:57, Carlos Ortega
>> (c...@qualityexcellence.es ) escribió:
>> 
>> Hola,
>> 
>> No entiendo muy bien lo que comentas de que aparecen
>> nuevas variables.
>> De esta forma calculo un nuevo "Sepal.Length" que es el
>> valor anterior multiplicado por 2.
>> 
>>> myiris %>%
>> + mutate( mynewSL = lag(Sepal.Length) * 2) %>%
>> + relocate( mynewSL, .before = Sepal.Width) %>%
>> + head()
>> Sepal.Length mynewSL Sepal.Width Petal.Length
>> Petal.Width Species
>> 1 *5.1 * NA 3.5 1.4 0.2 setosa
>> 2 4.9 *10.2 * 3.0 1.4 0.2
>> setosa
>> 3 4.7 9.8 3.2 1.3 0.2
>> setosa
>> 4 4.6 9.4 3.1 1.5 0.2
>> setosa
>> 5 5.0 9.2 3.6 1.4 0.2
>> setosa
>> 6 5.4 10.0 3.9 1.7 0.4
>> setosa
>> 
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es  
>> >
>> 
>> El mar, 5 jul 2022 a las 21:47, Andrés Hirigoyen
>> (mailto:andreshirigo...@gmail.com>>) escribió:
>> 
>> Hola Javier, gracias por tu respuesta.
>> Hice algo similar a lo que propones con la función
>> lag(), que retarda los
>> valores de la variable. El tema que cada vez que lo
>> calculo o me
>> sobreescribe o me genera una nueva columna y termino
>> con varias columnas
>> nuevas.
>> 
>> El mar, 5 jul 2022 a la(s) 16:36, Javier Marcuzzi (
>> javier.ruben.marcu...@gmail.com ) 
>> escribió:
>> 
>>> Estimado Andrés Hirigoyen
>>> 
>>> Es bastante complejo pero puede resultar simple.
>>> Todo depende de como trabajes con los datos, en una
>> oportunidad en esa
>>> lista me ayudaron utilizando do.call
>>> 
>>> Yo intentaría primero modificando los datos, por
>> ejemplo al data.frame
>>> original le tomo y realizo un contador, que inicie
>> en 0 e incremente en 1,
>>> a este resultado se lo agrego en una nueva columna
>> al mismo 

Re: [R-es] Ayuda con Función nueva variable

2022-07-06 Por tema Álvaro Hernández Vicente
Hola, Andrés:

Con la mezcla que has hecho de variables de distintos ejemplos no se 
entiende mucho lo que necesitas. Si la fórmula que tienes en tu excel es 
exactamente lo que quieres replicar en R, entonces puedes hacerlo con

dd <- tibble::tribble(~N1,  ~alfa,    ~NN,   NA, 
NA,   1025,   974, 0.2642, 1022.2, 
   938.1, 0.3754, 1016.9,   
908.9, 0.5014, 1006.4,   884.3, 0.6273,  986.1, 
   862.6,  0.738,  951.1,   
843.2,  0.825,  903.5,   825.4, 0.8875,  855.7) 
dd$nn_new <- 1025 for(i in 2:nrow(dd)){   dd$nn_new[i] <- (dd$nn_new[i - 
1] - (dd$nn_new[i - 1] - dd$N1[i])^dd$alfa[i]) }

Un saludo,
Álvaro


On 7/6/22 14:39, Andrés Hirigoyen wrote:
> Hola Javier y Carlos, adjunto un ejemplo en excel para explicarme 
> mejor, sigo sin conseguir el objetivo.
> Carlos, el valor inicial se lo doy como input.
> Saludos!
>
> El mar, 5 jul 2022 a la(s) 17:16, Carlos Ortega 
> (c...@qualityexcellence.es) escribió:
>
> Hola,
>
> Bueno, puedes combinar varios lags en la nueva variable...
>
> > library(dplyr)
> > myiris <- iris
> > alfa <- 1.7
> > expo <- 0.263
> > myiris %>%
> +   mutate( mynewSL = lag(Sepal.Length) * 2) %>%
> +   mutate( *mynewSLcompleja* =
> lag(Sepal.Length)*(lag(Sepal.Length)-alfa)^expo) %>%
> +   relocate( mynewSL, .before = Sepal.Width) %>%
> +   relocate( mynewSLcompleja, .before = mynewSL) %>%
> +   head()
>   Sepal.Length *mynewSLcompleja *mynewSL Sepal.Width Petal.Length
> Petal.Width Species
> 1 *5.1 *            NA      NA         3.5          1.4        
> 0.2  setosa
> 2          4.9 7.036378    10.2         3.0          1.4        
> 0.2  setosa
> 3          4.7        6.653506     9.8         3.2  1.3        
> 0.2  setosa
> 4          4.6        6.274523     9.4         3.1  1.5        
> 0.2  setosa
> 5          5.0        6.086512     9.2         3.6  1.4        
> 0.2  setosa
> 6          5.4        6.844460    10.0         3.9  1.7        
> 0.4  setosa
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es 
>
> El mar, 5 jul 2022 a las 22:07, Andrés Hirigoyen
> () escribió:
>
> Gracias Carlos.
> Siguiendo tu ejemplo, en mi nueva variable el valor de la
> observación 2 (*10.2*) es el valor que entra para calcular el
> valor de la observación 3 (*4.7 y 10.2*)
>
> NNn+1=10.2*(10.2-4.7)^0.263
> Saludos
>
> El mar, 5 jul 2022 a la(s) 16:57, Carlos Ortega
> (c...@qualityexcellence.es) escribió:
>
> Hola,
>
> No entiendo muy bien lo que comentas de que aparecen
> nuevas variables.
> De esta forma calculo un nuevo "Sepal.Length" que es el
> valor anterior multiplicado por 2.
>
> > myiris %>%
> +   mutate( mynewSL = lag(Sepal.Length) * 2) %>%
> +   relocate( mynewSL, .before = Sepal.Width) %>%
> +   head()
>   Sepal.Length mynewSL Sepal.Width Petal.Length
> Petal.Width Species
> 1 *5.1 *  NA         3.5          1.4     0.2  setosa
> 2          4.9 *10.2 *     3.0          1.4         0.2
>  setosa
> 3          4.7     9.8         3.2          1.3       0.2
>  setosa
> 4          4.6     9.4         3.1          1.5       0.2
>  setosa
> 5          5.0     9.2         3.6          1.4       0.2
>  setosa
> 6          5.4    10.0         3.9          1.7       0.4
>  setosa
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es 
>
> El mar, 5 jul 2022 a las 21:47, Andrés Hirigoyen
> () escribió:
>
> Hola Javier, gracias por tu respuesta.
> Hice algo similar a lo que propones con la función
> lag(), que retarda los
> valores de la variable. El tema que cada vez que lo
> calculo o me
> sobreescribe o me genera una nueva columna y termino
> con varias columnas
> nuevas.
>
> El mar, 5 jul 2022 a la(s) 16:36, Javier Marcuzzi (
> javier.ruben.marcu...@gmail.com) escribió:
>
> > Estimado Andrés Hirigoyen
> >
> > Es bastante complejo pero puede resultar simple.
> > Todo depende de como trabajes con los datos, en una
> oportunidad en esa
> > lista me ayudaron utilizando do.call
> >
> > Yo intentaría primero modificando los datos, por
> ejemplo al data.frame
>  

Re: [R-es] Ayuda con Función nueva variable

2022-07-06 Por tema Andrés Hirigoyen
Hola Javier y Carlos, adjunto un ejemplo en excel para explicarme mejor,
sigo sin conseguir el objetivo.
Carlos, el valor inicial se lo doy como input.
Saludos!

El mar, 5 jul 2022 a la(s) 17:16, Carlos Ortega (c...@qualityexcellence.es)
escribió:

> Hola,
>
> Bueno, puedes combinar varios lags en la nueva variable...
>
> > library(dplyr)
> > myiris <- iris
> > alfa <- 1.7
> > expo <- 0.263
> > myiris %>%
> +   mutate( mynewSL = lag(Sepal.Length) * 2) %>%
> +   mutate( *mynewSLcompleja* =
> lag(Sepal.Length)*(lag(Sepal.Length)-alfa)^expo) %>%
> +   relocate( mynewSL, .before = Sepal.Width) %>%
> +   relocate( mynewSLcompleja, .before = mynewSL) %>%
> +   head()
>   Sepal.Length *mynewSLcompleja *mynewSL Sepal.Width Petal.Length
> Petal.Width Species
> 1  *5.1  *NA  NA 3.5  1.4
> 0.2  setosa
> 2  4.97.03637810.2 3.0  1.4
> 0.2  setosa
> 3  4.76.653506 9.8 3.2  1.3
> 0.2  setosa
> 4  4.66.274523 9.4 3.1  1.5
> 0.2  setosa
> 5  5.06.086512 9.2 3.6  1.4
> 0.2  setosa
> 6  5.46.84446010.0 3.9  1.7
> 0.4  setosa
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mar, 5 jul 2022 a las 22:07, Andrés Hirigoyen (<
> andreshirigo...@gmail.com>) escribió:
>
>> Gracias Carlos.
>> Siguiendo tu ejemplo, en mi nueva variable el valor de la observación 2 (
>> *10.2*) es el valor que entra para calcular el valor de la observación 3
>> (*4.7 y 10.2*)
>>
>> NNn+1=10.2*(10.2-4.7)^0.263
>> Saludos
>>
>> El mar, 5 jul 2022 a la(s) 16:57, Carlos Ortega (c...@qualityexcellence.es)
>> escribió:
>>
>>> Hola,
>>>
>>> No entiendo muy bien lo que comentas de que aparecen nuevas variables.
>>> De esta forma calculo un nuevo "Sepal.Length" que es el valor anterior
>>> multiplicado por 2.
>>>
>>> > myiris %>%
>>> +   mutate( mynewSL = lag(Sepal.Length) * 2) %>%
>>> +   relocate( mynewSL, .before = Sepal.Width) %>%
>>> +   head()
>>>   Sepal.Length mynewSL Sepal.Width Petal.Length Petal.Width Species
>>> 1  *5.1 * NA 3.5  1.4 0.2  setosa
>>> 2  4.9*10.2   *  3.0  1.4 0.2  setosa
>>> 3  4.7 9.8 3.2  1.3 0.2  setosa
>>> 4  4.6 9.4 3.1  1.5 0.2  setosa
>>> 5  5.0 9.2 3.6  1.4 0.2  setosa
>>> 6  5.410.0 3.9  1.7 0.4  setosa
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El mar, 5 jul 2022 a las 21:47, Andrés Hirigoyen (<
>>> andreshirigo...@gmail.com>) escribió:
>>>
 Hola Javier, gracias por tu respuesta.
 Hice algo similar a lo que propones con la función lag(), que retarda
 los
 valores de la variable. El tema que cada vez que lo calculo o me
 sobreescribe o me genera una nueva columna y termino con varias columnas
 nuevas.

 El mar, 5 jul 2022 a la(s) 16:36, Javier Marcuzzi (
 javier.ruben.marcu...@gmail.com) escribió:

 > Estimado Andrés Hirigoyen
 >
 > Es bastante complejo pero puede resultar simple.
 > Todo depende de como trabajes con los datos, en una oportunidad en esa
 > lista me ayudaron utilizando do.call
 >
 > Yo intentaría primero modificando los datos, por ejemplo al data.frame
 > original le tomo y realizo un contador, que inicie en 0 e incremente
 en 1,
 > a este resultado se lo agrego en una nueva columna al mismo
 data.frame.
 >
 > Suponiendo que en los datos, cada registro tiene una numeración que
 inicia
 > en 1, la columna agregada comienza en 0, por lo que puedo realizar una
 > búsqueda de una columna sobre la otra que está corrida justo un
 número,
 > pero en la misma fila de datos, lo que facilita el recorrido.
 >
 > Es una idea, seguramente hay formas más eficientes, pero esta es
 simple de
 > entender.
 >
 > Javier Rubén Marcuzzi
 >
 >
 > > El 5 jul. 2022, a las 15:59, Andrés Hirigoyen <
 andreshirigo...@gmail.com>
 > escribió:
 > >
 > > Buenas tardes.
 > > Necesito ayuda para hacer una función o un bucle que me permita
 calcular
 > > una nueva variable empleando el valor anterior de la misma (para la
 > > observación anterior). En un dataframe de varias columnas.
 > >
 > > Por ejemplo:
 > > Para calcular el valor de NN para la observación 2, emplea el NN de
 la
 > > observación 1, para el NN de la tercera emplea el NN de la segunda y
 > > así hasta todas las observaciones.
 > > Algo así:
 > > NN(i-1)<-valor inicial
 > > NNi=NN(i-1)*(NN(i-1)-Alfa)^0.263
 > > NNi+1=NN(i)*(NN(i)-Alfa)^0.263...
 > >
 > > NNn+1=NN(n)*(NN(n)-Alfa)^0.263
 > > He intentado varias cosas pero no tuve suerte. Desde ya muchas
 gracias
 > > --
 

Re: [R-es] Ayuda con Función nueva variable

2022-07-05 Por tema Javier Marcuzzi
Hola Andrés

No, no se complique, todo depende de cómo tiene los datos, pero puede ser 
tan simple como leer desde el data.frame un valor, a este sumarle 1 o restar 1, 
y agregarlo en una nueva columna en el data.frame. Sin funciones raras, solo 
con + o -. O muy complicado, a mí me llevó casi una semana encontrar el 
“bendito” contador.

Javier Marcuzzi

> El 5 jul. 2022, a las 16:43, Andrés Hirigoyen  
> escribió:
> 
> Hola Javier, gracias por tu respuesta.
> Hice algo similar a lo que propones con la función lag(), que retarda los 
> valores de la variable. El tema que cada vez que lo calculo o me sobreescribe 
> o me genera una nueva columna y termino con varias columnas nuevas. 
> 
> El mar, 5 jul 2022 a la(s) 16:36, Javier Marcuzzi 
> (javier.ruben.marcu...@gmail.com ) 
> escribió:
> Estimado Andrés Hirigoyen
> 
> Es bastante complejo pero puede resultar simple.
> Todo depende de como trabajes con los datos, en una oportunidad en esa lista 
> me ayudaron utilizando do.call 
> 
> Yo intentaría primero modificando los datos, por ejemplo al data.frame 
> original le tomo y realizo un contador, que inicie en 0 e incremente en 1, a 
> este resultado se lo agrego en una nueva columna al mismo data.frame.
> 
> Suponiendo que en los datos, cada registro tiene una numeración que inicia en 
> 1, la columna agregada comienza en 0, por lo que puedo realizar una búsqueda 
> de una columna sobre la otra que está corrida justo un número, pero en la 
> misma fila de datos, lo que facilita el recorrido.
> 
> Es una idea, seguramente hay formas más eficientes, pero esta es simple de 
> entender.
> 
> Javier Rubén Marcuzzi
> 
> 
> > El 5 jul. 2022, a las 15:59, Andrés Hirigoyen  > > escribió:
> > 
> > Buenas tardes.
> > Necesito ayuda para hacer una función o un bucle que me permita calcular
> > una nueva variable empleando el valor anterior de la misma (para la
> > observación anterior). En un dataframe de varias columnas.
> > 
> > Por ejemplo:
> > Para calcular el valor de NN para la observación 2, emplea el NN de la
> > observación 1, para el NN de la tercera emplea el NN de la segunda y
> > así hasta todas las observaciones.
> > Algo así:
> > NN(i-1)<-valor inicial
> > NNi=NN(i-1)*(NN(i-1)-Alfa)^0.263
> > NNi+1=NN(i)*(NN(i)-Alfa)^0.263...
> > 
> > NNn+1=NN(n)*(NN(n)-Alfa)^0.263
> > He intentado varias cosas pero no tuve suerte. Desde ya muchas gracias
> > -- 
> > 
> > 
> >   -
> > 
> >   [[alternative HTML version deleted]]
> > 
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org 
> > https://stat.ethz.ch/mailman/listinfo/r-help-es 
> > 
> 
> 
> 
> -- 
>  Dr. Andrés Hirigoyen
> Ing. Agr. (MSc)
>  Prof. Ciencias Biológicas
> Scholar Andrés 
> 
> Researchgate Andrés 
>   


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda para campo con numerico y texto con Problemas

2019-03-18 Por tema Isidro Hidalgo Arellano
Si lo necesitas, yo puedo pasarte el nombre de las localidades de Castilla-La 
Mancha de cuatro formas diferentes.

Un saludo

 

Isidro Hidalgo Arellano

Observatorio del Mercado de Trabajo

Consejería de Economía, Empresas y Empleo

  http://www.castillalamancha.es/

 

 

 

De: R-help-es  En nombre de Maria Ruiz
Enviado el: domingo, 17 de marzo de 2019 19:17
Para: r-help-es@r-project.org
Asunto: [R-es] Ayuda para campo con numerico y texto con Problemas

 

Hola a todos, 

Soy nueva usando R y tengo unos problema en procesado de datos que quiero hacer 
en R.

 

Tengo un fichero de datos  en formato texto separado con ; (punto y coma).

Este fichero contiene las columnas:

Poblacion;Sexo;Nota; EdadP, EdadM

Tengo 2 problemas que no se como  tratar.

1.- Problema

La  columna Poblacion debo tenerla  siempre con la primera letra en mayúsculas 
y  tengo poblaciones  que tiene artículos o prepsosicones entre medias como por 
ejemplo: ( de, del,, las...)

Albaida del Aljarafe o  Santa Cruz de  Tenerife, tambien tengo algunas con 
Valencia, valencia, y (blanco)Valencia o Valencia(blanco) 

 

 

NO sé cémo tratar este dato para que solo aparezca en La primera letra  de cada 
palabra y no los enlace o artículos, es decir no debe aparecer: del o de .

 

2,. Problema

La columna Nota por  hay errores y los datos no todso son de tipo 7.8 o 8.9 

Parece que han errores y tengo algunos  6,5 o 6,9

ES decir han introducido la coma como separador decimal en vez de punto. 

 

Nota podria corregir los errores con otro programa pero quiero hacerlo todo con 
R.

 

Gracias y espero un pronta respuesta  

Adjunto un troz del fichero

 

 

Un trozo de ejemplo del fichero :

Poblacion;Sexo;Nota;EdadP;EdadM

  Valencia ;m;7.23;45;34

Albaida del Aljarafe;M;5.93;36;37

valencia;M;NA;34;35

Barcelona;M;6.33;37;29

Albalate de las Nogueras;  M;8.93;35;26

  Valencia ;M;7.23;29;44

Santa Cruz de Tenerife;  M   ;NA;26;23

Valencia;M;9.23;44;46

Valencia;  M   ;7.63;23;35

Valencia ;M;5.73;46;31

 Valencia;M;5.03;35;35

Valencia;M;NA;31;-24

Valencia;M   ;6.13;35;28

Albalate de las Nogueras;  M;7.63;24;37

 Valencia;M   ;7.53;28;26

 Valencia;  M;6.33;37;20

Santa Cruz de Tenerife;M;5.33;26;25

Santa cruz de Tenerife;  m;7.33;20;35

 Santa Cruz de tenerife;M;8.23;-25;39

Santa cruz de tenerife;M   ;6.93;35;36

valencia;  M;5.33;39;44

 Valencia;  M;7.73;36;46

  Valencia;M   ;6.23;44;35

 Valencia;M;6.43;40;31

Santa cruz de Tenerife;  m;6.83;36;35

valencia;M;5,73;39;24

  valencia;M;6.23;58;28

 valencia ;  m;7.03;50;37

Albalate de las Nogueras;  m;7.33;20;35

Albaida del Aljarafe;M;8.23;25;39


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda para campo con numerico y texto con Problemas

2019-03-17 Por tema Juan Abasolo
Se me ocurre, María, que si lo que tenés que hacer es diseñar hoy un
trabajo para desarrollarlo durante un período largo de tiempo (o a volver a
hacer el año  que viene y el siguiente y así), una buena manera sería,
hacer algo así:
1. Por un lado normalizar todos tus datos de alguna manera consistente

Tipo, pasar todos los nombres a minúsculas [tolower()] *las palmas*, *jerez
de la frontera* y cosas así. O todo mayúscula [toupper()], como más rabia
te de., y quitar los espacios del final y del principio que pudieran
tener., para evitar * santa cruz de tenerife * o cosas así.

stringr::str_trim(levels(tu.vector.de.nombres), 'left') # o rigth, claro

Con eso ya tenés los datos de alguna manera consistenete para trabajar. Te
falta resolver lo de presentar los datos tipo *Jerez de la Frontera*.
Como me parece que es un ĺío hacer algo que te ponga en mayúscula lo que
toca en mayúscula y en minúscula lo que toca, lo que haría es:
2. Generá otro fichero con los nombres oficiales (o como te los den) de los
pueblos. Mejor, si además los tenés divididos en comarcas / provincias /
comunidades autonomas / ...

medí las distancia de edición entre tu valor con el de la lista buena:
stringdist('jerez de la frontera', tolower('Jerez de la Frontera'), method
= 'lv')

La distancia = 0 es el pueblo que buscás. Con generar el índice de
correspondencias una sola vez, ya lo tenés, me parece.

Te comentaron lo de nombres en diferentes idiomas, también. Onda Orense /
Ourense, San Sebastián / Donostia... . Supongo que acerlo con dos columnas,
una para el nombre del sitio y otro para la denominación tradicional
castellana, se comprueba en las dos y cualquier distancia 0 es la correcta.




Hau idatzi du Javier Marcuzzi (javier.ruben.marcu...@gmail.com)
erabiltzaileak (2019 mar. 17, ig. (22:25)):

> Estimada María Ruiz
>
> Comprendo lo que usted dice, en realidad no son tantos datos para R, a mi
> me paso algo semejante con una consultora con informáticos, etc., pero los
> datos… U
>
> Puedes, es muy trabajoso, yo estuve un mes para resolver mi problema,
> básicamente tendrá que importar los datos de la mejor manera que pueda,
> luego ir buscando con expresiones regulares y cuánto recurso se le venga en
> mente para pasar el texto a formato de datos válido, seguramente algo
> andará bien, en un fragmento fallará, aparecerán casos con espacios en
> blanco, la misma palabra con mayúsculas o minúsculas, en otras palabras, un
> montón de posibilidades, lógicamente que a cada una debe contemplarla en R,
> y eso lleva horas, días, y mucho pero mucho ingenio con los datos, o mejor
> dicho, con el texto que debe ser pasado a datos para luego comenzar algún
> análisis. Con R se puede, pero el trabajo es tanto que yo no aceptaría el
> compromiso si lo veo muy complicado, salvo un presupuesto acorde, es un
> esfuerzo enorme que no todos comprenderán ni estarán dispuestos a
> compensar.
>
>
> Javier Rubén Marcuzzi
>
> El dom., 17 mar. 2019 a las 17:40, Francisco Rodríguez (<
> fjr...@hotmail.com>)
> escribió:
>
> > Por lo que intuyo. Vas a bajar a nivel de municipios?  Si es así hay que
> > trabajar con texto y va ser tedioso si hay varias CCAA. Hay sólo una
> > comunidad?  Si hay varias tendrás pb con los idiomas si bajas a
> municipio.
> > Si no te dan los ficheros normalizados te toca trabajar los textos. Si
> vas
> > a nivel provincia, sólo sería algunas columnas y corregir algunas cosas
> > pero algo de dificultad media - baja
> >
> >
> >
> > Enviado de Samsung Mobile
> >
> >
> >  Mensaje original 
> > De: Maria Ruiz 
> > Fecha: 17/3/19 21:28 (GMT+01:00)
> > Para: r-help-es@r-project.org
> > Asunto: Re: [R-es] Ayuda para campo con numerico y texto con Problemas
> >
> > Por parte No puedo usar otra cosa que sea R, por motivos  varios, Uno de
> > ellos es  tporque quiero  hacer un script para introducir cada provincia
> > conforme llegue, y es son muchos datos para hacerlo con excel, y tambnie
> > que si lo hago mas año seria muy pesado.
> >
> >
> >
> > Primero  que esta pasando que me mandan  los difrentes ficheros con datos
> > de diferentes provincias y para su posterior anàlisis y no puedo ir
> > mirarado los todos.
> >
> > Por otra parte tampoco tengo codigos munipales como indica Javier, sino
> > esos datos tal cual, ciudades. sin mas.
> >
> >
> >
> > No son pocos datos son  los alumnos que este año  2018 realizaron la
> > selectividad en uan comunida autònoma, mas 30.000.
> >
> > Se que debe  existir algun paramentro al ahora de importar el dataframe
> >
> >
> >
> > Dataset <- read.table("C:/Users/datos.csv", header=

Re: [R-es] Ayuda para campo con numerico y texto con Problemas

2019-03-17 Por tema Javier Marcuzzi
Estimada María Ruiz

Comprendo lo que usted dice, en realidad no son tantos datos para R, a mi
me paso algo semejante con una consultora con informáticos, etc., pero los
datos… U

Puedes, es muy trabajoso, yo estuve un mes para resolver mi problema,
básicamente tendrá que importar los datos de la mejor manera que pueda,
luego ir buscando con expresiones regulares y cuánto recurso se le venga en
mente para pasar el texto a formato de datos válido, seguramente algo
andará bien, en un fragmento fallará, aparecerán casos con espacios en
blanco, la misma palabra con mayúsculas o minúsculas, en otras palabras, un
montón de posibilidades, lógicamente que a cada una debe contemplarla en R,
y eso lleva horas, días, y mucho pero mucho ingenio con los datos, o mejor
dicho, con el texto que debe ser pasado a datos para luego comenzar algún
análisis. Con R se puede, pero el trabajo es tanto que yo no aceptaría el
compromiso si lo veo muy complicado, salvo un presupuesto acorde, es un
esfuerzo enorme que no todos comprenderán ni estarán dispuestos a compensar.


Javier Rubén Marcuzzi

El dom., 17 mar. 2019 a las 17:40, Francisco Rodríguez ()
escribió:

> Por lo que intuyo. Vas a bajar a nivel de municipios?  Si es así hay que
> trabajar con texto y va ser tedioso si hay varias CCAA. Hay sólo una
> comunidad?  Si hay varias tendrás pb con los idiomas si bajas a municipio.
> Si no te dan los ficheros normalizados te toca trabajar los textos. Si vas
> a nivel provincia, sólo sería algunas columnas y corregir algunas cosas
> pero algo de dificultad media - baja
>
>
>
> Enviado de Samsung Mobile
>
>
>  Mensaje original 
> De: Maria Ruiz 
> Fecha: 17/3/19 21:28 (GMT+01:00)
> Para: r-help-es@r-project.org
> Asunto: Re: [R-es] Ayuda para campo con numerico y texto con Problemas
>
> Por parte No puedo usar otra cosa que sea R, por motivos  varios, Uno de
> ellos es  tporque quiero  hacer un script para introducir cada provincia
> conforme llegue, y es son muchos datos para hacerlo con excel, y tambnie
> que si lo hago mas año seria muy pesado.
>
>
>
> Primero  que esta pasando que me mandan  los difrentes ficheros con datos
> de diferentes provincias y para su posterior anàlisis y no puedo ir
> mirarado los todos.
>
> Por otra parte tampoco tengo codigos munipales como indica Javier, sino
> esos datos tal cual, ciudades. sin mas.
>
>
>
> No son pocos datos son  los alumnos que este año  2018 realizaron la
> selectividad en uan comunida autònoma, mas 30.000.
>
> Se que debe  existir algun paramentro al ahora de importar el dataframe
>
>
>
> Dataset <- read.table("C:/Users/datos.csv", header=TRUE, sep=",",
> na.strings="NA", dec=".", strip.white=TRUE)
>
>
>
>
>  M. JOsé
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda para campo con numerico y texto con Problemas

2019-03-17 Por tema Maria Ruiz
Por parte No puedo usar otra cosa que sea R, por motivos  varios, Uno de
ellos es  tporque quiero  hacer un script para introducir cada provincia
conforme llegue, y es son muchos datos para hacerlo con excel, y tambnie
que si lo hago mas año seria muy pesado.



Primero  que esta pasando que me mandan  los difrentes ficheros con datos
de diferentes provincias y para su posterior anàlisis y no puedo ir
mirarado los todos.

Por otra parte tampoco tengo codigos munipales como indica Javier, sino
esos datos tal cual, ciudades. sin mas.



No son pocos datos son  los alumnos que este año  2018 realizaron la
selectividad en uan comunida autònoma, mas 30.000.

Se que debe  existir algun paramentro al ahora de importar el dataframe



Dataset <- read.table("C:/Users/datos.csv", header=TRUE, sep=",",
na.strings="NA", dec=".", strip.white=TRUE)




 M. JOsé

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda para campo con numerico y texto con Problemas

2019-03-17 Por tema Javier Marcuzzi
Estimada María Ruiz.
Lo más simple, si son pocos datos, arregle los datos con excel, una base de
datos, etc. Limpieza de datos fuera de R. Luego, las palabras y su trabajo,
mire tm, texto mining.
Saludos
Javier Rubén Marcuzzi

El dom., 17 de mar. de 2019 3:17 PM, Maria Ruiz 
escribió:

> Hola a todos,
> Soy nueva usando R y tengo unos problema en procesado de datos que quiero
> hacer en R.
>
> Tengo un fichero de datos  en formato texto separado con ; (punto y coma).
> Este fichero contiene las columnas:
> Poblacion;Sexo;Nota; EdadP, EdadM
> Tengo 2 problemas que no se como  tratar.
> 1.- Problema
> La  columna *Poblacion* debo tenerla  siempre con la primera letra en
> mayúsculas y  tengo poblaciones  que tiene artículos o prepsosicones entre
> medias como por ejemplo: ( de, del,, las...)
> Albaida *de*l Aljarafe o  Santa Cruz de  Tenerife, tambien tengo algunas
> con Valencia, valencia, y (blanco)Valencia o Valencia(blanco)
>
>
> NO sé cémo tratar este dato para que solo aparezca en La primera letra  de
> cada palabra y no los enlace o artículos, es decir no debe aparecer: del o
> de .
>
> 2,. Problema
> La columna *Nota* por  hay errores y los datos no todso son de tipo 7.8 o
> 8.9
> Parece que han errores y tengo algunos  6,5 o 6,9
> ES decir han introducido la coma como separador decimal en vez de punto.
>
> Nota podria corregir los errores con otro programa pero quiero hacerlo
> todo con R.
>
> Gracias y espero un pronta respuesta
> Adjunto un troz del fichero
>
>
> Un trozo de ejemplo del fichero :
>
> Poblacion;Sexo;Nota;EdadP;EdadM
>
>   Valencia ;m;7.23;45;34
>
> Albaida del Aljarafe;M;5.93;36;37
>
> valencia;M;NA;34;35
>
> Barcelona;M;6.33;37;29
>
> Albalate de las Nogueras;  M;8.93;35;26
>
>   Valencia ;M;7.23;29;44
>
> Santa Cruz de Tenerife;  M   ;NA;26;23
>
> Valencia;M;9.23;44;46
>
> Valencia;  M   ;7.63;23;35
>
> Valencia ;M;5.73;46;31
>
>  Valencia;M;5.03;35;35
>
> Valencia;M;NA;31;-24
>
> Valencia;M   ;6.13;35;28
>
> Albalate de las Nogueras;  M;7.63;24;37
>
>  Valencia;M   ;7.53;28;26
>
>  Valencia;  M;6.33;37;20
>
> Santa Cruz de Tenerife;M;5.33;26;25
>
> Santa cruz de Tenerife;  m;7.33;20;35
>
>  Santa Cruz de tenerife;M;8.23;-25;39
>
> Santa cruz de tenerife;M   ;6.93;35;36
>
> valencia;  M;5.33;39;44
>
>  Valencia;  M;7.73;36;46
>
>   Valencia;M   ;6.23;44;35
>
>  Valencia;M;6.43;40;31
>
> Santa cruz de Tenerife;  m;6.83;36;35
>
> valencia;M;5,73;39;24
>
>   valencia;M;6.23;58;28
>
>  valencia ;  m;7.03;50;37
>
> Albalate de las Nogueras;  m;7.33;20;35
>
> Albaida del Aljarafe;M;8.23;25;39
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda !!!!!

2019-02-05 Por tema Javier Marcuzzi
Estimado

Parece la tarea de la escuela.

¿Que parte específica de R no comprende? Por ejemplo hist()

Javier Rubén Marcuzzi

El mar., 5 feb. 2019 a las 20:43, Jhon Vidal Figueroa Céspedes (<
asroden...@gmail.com>) escribió:

> 1. Implementar una rutina en R que permita estimar un modelo de regresión
> lineal omitiendo un registro. Use el archivo de datos Datos_Trabajo_R.xlsx.
> Observación: si el archivo contiene n registros, entonces se estimarán n
> regresiones con (n-1) registros cada una.
> a) El programa deberá mostrar un gráfico de dispersión cuyo eje X sería el
> número de regresión y el eje Y el valor de la pendiente de la regresión.
> b) ¿Cuál es el valor de la pendiente más grande y más pequeña?, ¿A qué
> registros están asociados estas pendientes?
> c) Calcule la pendiente promedio de todas las regresiones; y compare está
> pendiente con la pendiente de la regresión con todas las observaciones.
>
> 2. Implementar una rutina en R que permita calcular la distancia de
> Mahalanobis de un registro xi al vector de medias calculado sin el registro
> xi. Muestre un histograma de estas distancias para visualizar las
> distancias más grandes.
> Observación: esta medida es sensible a la presencia de datos atípicos
> multivariantes.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con calculo de variables / transponer R

2019-02-04 Por tema Paulina Jara Armijo
¡Gracias!

El lun., 4 feb. 2019 a las 21:25, Carlos Ortega ()
escribió:

> Hola,
>
> Lo puedes hacer con la función "gather()" del paquete "tidyr".
> De esta forma:
>
> > datos <- data.frame(
> +   Date = c("2018-01-01", "2018-01-02", "2018-01-03", "2018-01-04"),
> +   Berri = c(2, 3,4,6),
> +   Boyer = c(10,20,30,40)
> + )
> >
> > library(tidyverse)
> > datos_new <- datos %>%
> +   gather(District, N, -Date)
> > datos_new
> Date District  N
> 1 2018-01-01Berri  2
> 2 2018-01-02Berri  3
> 3 2018-01-03Berri  4
> 4 2018-01-04Berri  6
> 5 2018-01-01Boyer 10
> 6 2018-01-02Boyer 20
> 7 2018-01-03Boyer 30
> 8 2018-01-04Boyer 40
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El lun., 4 feb. 2019 a las 19:42, Paulina Jara Armijo (<
> jara.armijo.paul...@gmail.com>) escribió:
>
>> Buenas tardes, tengo dudas con el siguiente ejercicio que me han
>> propuesto en un curso, no se si alguien podria indicarme como abordarlo,
>> soy nueva en R y agradezco mucho su ayuda
>>
>> Identi car cuales son las variables que están contenidas en
>> el data.frame. A continuación, transformar ese data.frame para que
>> cada columna represente cada una de las variables. Usar los nombres
>> Date, District y N.
>> [image: image.png]
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con calculo de variables / transponer R

2019-02-04 Por tema Carlos Ortega
Hola,

Lo puedes hacer con la función "gather()" del paquete "tidyr".
De esta forma:

> datos <- data.frame(
+   Date = c("2018-01-01", "2018-01-02", "2018-01-03", "2018-01-04"),
+   Berri = c(2, 3,4,6),
+   Boyer = c(10,20,30,40)
+ )
>
> library(tidyverse)
> datos_new <- datos %>%
+   gather(District, N, -Date)
> datos_new
Date District  N
1 2018-01-01Berri  2
2 2018-01-02Berri  3
3 2018-01-03Berri  4
4 2018-01-04Berri  6
5 2018-01-01Boyer 10
6 2018-01-02Boyer 20
7 2018-01-03Boyer 30
8 2018-01-04Boyer 40

Saludos,
Carlos Ortega
www.qualityexcellence.es


El lun., 4 feb. 2019 a las 19:42, Paulina Jara Armijo (<
jara.armijo.paul...@gmail.com>) escribió:

> Buenas tardes, tengo dudas con el siguiente ejercicio que me han propuesto
> en un curso, no se si alguien podria indicarme como abordarlo, soy nueva en
> R y agradezco mucho su ayuda
>
> Identi car cuales son las variables que están contenidas en
> el data.frame. A continuación, transformar ese data.frame para que
> cada columna represente cada una de las variables. Usar los nombres
> Date, District y N.
> [image: image.png]
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda ggplot

2018-07-27 Por tema Carlos Ortega
Hola,

Aquí dan detalles de cómo hacerlo.

https://stackoverflow.com/questions/4332274/how-can-a-line-be-overlaid-on-a-bar-plot-using-ggplot2

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 27 de julio de 2018, 13:13, Jaume Tormo  escribió:

> Yo hice una vea un gráfico parecido, sin ggplot, el gráfico está aquí:
> https://acercad.wordpress.com/2009/05/05/acerca-de-otra-grafica-en-r/
>
> Jaume.
>
> El lunes, 23 de julio de 2018, Dayana Muñoz 
> escribió:
>
>> Estimad@s,
>>
>> Junto con saludar, quería saber si alguien me podría ayudar con este
>> gráfico, tengo un análisis de datos del año 2016 de 3 variables con dos
>> dimensiones (muestra objetivo y muestra lograda), y quería agregar la
>> comparación con el año 2015, me gustaría agregar un gráfico de linea y
>> puntos para el año 2015, pero no he podido lograrlo , la idea es generar un
>> gráfico de esta forma.  Adjunto mi scrip y mis bases.
>>
>> Agradeceré su colaboración.
>>
>>
>>
>>
>>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda ggplot

2018-07-23 Por tema Javier Marcuzzi
Estimada Dayana Muñoz

Si comprendo bien su correo, usted desea un gráfico como el ejemplo que
envía, donde se ven 6 columnas y una línea que recorre todas las columnas,
desde mi punto de vista eso es inconsistente, la línea iría para mostrar en
el incremento o decremento a lo largo del tiempo de una variable, pero
usted utiliza la misma línea para las tres.

Javier Rubén Marcuzzi

El lun., 23 jul. 2018 a las 10:55, Dayana Muñoz ()
escribió:

> Estimad@s,
>
> Junto con saludar, quería saber si alguien me podría ayudar con este
> gráfico, tengo un análisis de datos del año 2016 de 3 variables con dos
> dimensiones (muestra objetivo y muestra lograda), y quería agregar la
> comparación con el año 2015, me gustaría agregar un gráfico de linea y
> puntos para el año 2015, pero no he podido lograrlo , la idea es generar un
> gráfico de esta forma.  Adjunto mi scrip y mis bases.
>
> Agradeceré su colaboración.
>
>
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda ggplot

2018-07-23 Por tema jose luis via R-help-es
 HolaExactamente.. ¿qué uniria la linea y los puntos?
En lunes, 23 de julio de 2018 15:55:53 CEST, Dayana Muñoz 
 escribió:  
 
  #yiv4057929109 P {margin-top:0;margin-bottom:0;}Estimad@s,
Junto con saludar, quería saber si alguien me podría ayudar con este gráfico, 
tengo un análisis de datos del año 2016 de 3 variables con dos dimensiones 
(muestra objetivo y muestra lograda), y quería agregar la comparación con el 
año 2015, me gustaría agregar un gráfico de linea y puntos para el año 2015, 
pero no he podido lograrlo , la idea es generar un gráfico de esta forma.  
Adjunto mi scrip y mis bases.
Agradeceré su colaboración.



___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es  ___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Por tema Carlos Ortega
Hola,

Repasa muy bien dos cosas:

   - El nombre de tu variable.
   - en tu primer correo la variable se llama "DIVISION" todo en mayúsculas.
  - Y en lo que has hecho con "ifelse()" pones "División".
  - Para "R" los dos nombres son diferentes.
  - Y cuidado con los acentos...si es posible no los pongas.
   - Si todo lo anterior era consistente (los nombres estaban bien, eran
   iguales en los dos casos).
  - Prueba a ver la clases de la variable.
  - Haz "class(BD$nombre_variable)"
 - Puede que tu variable sea de clase "character" y no puedas
 entonces aplicar una condición (ifelse) pensando que es un número...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 23 de marzo de 2018, 15:37, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimada Dayana Muñoz
>
> Leí muy rápido para dar una respuesta acertada y completa, pero en el
> primer if hay un problema, no use tantos ifelse, y el 59 no tiene donde ir,
> porque busca los menores y luego los iguales o mayores a 60.
>
> Javier Rubén Marcuzzi
>
> El 23 de marzo de 2018, 11:12, Dayana Muñoz <dayanaa...@hotmail.com>
> escribió:
>
> > He tratado de usar lo siguiente:
> >
> > a<- ifelse(BD$División>=50 &  BD$División<59,"D",
> >  ifelse (BD$División>=60  &  BD$División<=69,"G",
> >  ifelse (BD$División>=70  &
> > BD$División<=79,"L",
> >  ifelse (BD$División>=80  &
> > BD$División<=89,"M",
> >  ifelse (BD$División>=90
> > &  BD$División<=99,"N","Z")
> >
> >
> >
> > Pero me arroja puros NA como resultado.
> >
> >
> >
> >
> >
> > --
> > *De:* Javier Marcuzzi <javier.ruben.marcu...@gmail.com>
> > *Enviado:* viernes, 23 de marzo de 2018 11:04:16
> > *Para:* Dayana Muñoz
> > *Cc:* r-help-es@r-project.org
> > *Asunto:* Re: [R-es] Ayuda con R-Studio condiciones
> >
> > Estimada Dayana Muñoz
> >
> > Separemos el problema en dos, la primer parte es la condición, para esto
> > puede utilizar la forma que le resulte más apropiada, la segunda parte es
> > utilizar por ejemplo cbind al data.frame original, en otras palabras a
> los
> > datos les pega el resultado de la condición en una nueva columna.
> >
> > Javier Rubén Marcuzzi
> >
> > El 23 de marzo de 2018, 10:54, Dayana Muñoz <dayanaa...@hotmail.com>
> > escribió:
> >
> > Estimados,
> >
> >
> > Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> > que tengo: Tengo una base de datos llamada "BD", la cuál posee 300
> columnas
> > y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> > dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva
> columna
> > (adicional), llamada "SECCION" que me clasifique con letras los valores
> > numéricos que tengo en la columna "DIVISION":
> >
> >
> > ID  TAMAÑO x
> > DIVISION  GRUPOCLASE
> >
> > 338576
> >
> >
> >
> > Grande
> >
> > 2
> >
> > 82
> >
> > 821
> >
> > 8219
> >
> > 338421
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 58
> >
> > 581
> >
> > 5813
> >
> > 352821
> >
> >
> >
> > Mediana
> >
> > 2
> >
> > 96
> >
> > 960
> >
> > 9603
> >
> > 340936
> >
> >
> >
> > Grande
> >
> > 1
> >
> > 68
> >
> > 681
> >
> > 6810
> >
> > 340937
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 77
> >
> > 773
> >
> > 7730
> >
> > 340938
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 71
> >
> > 712
> >
> > 7120
> >
> > 353517
> >
> >
> >
> > Grande
> >
> > 1
> >
> > 73
> >
> > 731
> >
> > 7310
> >
> > 340940
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 71
> >
> > 711
> >
> > 7110
> >
> > 340941
> >
> >
> >
> > Grande
>

Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Por tema Xavier-Andoni Tibau Alberdi
Crea una funcion y luego la aplicas. La función seria la que ya has creado,
pero cambia  BD$División por x.

Algo así como:
recodificar <- function (x){
ifelse(x>=50 &  x<59,"D",
 ifelse (x>=60  &  x<=69,"G",
 ifelse (x>=70  &  x<=79,"L",
 ifelse (x>=80  &  x<=89,"M",
 ifelse (x>=90  &
x<=99,"N","Z")
}

Y luego la aplicas.

BD$Nueva_variable <- recodificar( BD$División).

 Eso deveria funcionar y no necesitas unir columnas.

Saludos,

——
*Deutsches Zentrum für Luft- und Raumfahrt* e.V. (DLR)
German Aerospace Center

Xavier-Andoni Tibau Alberdi | Scientific Staff
Institute of Data Science | Data Management and Analysis | Mälzerstraße 3 |
07745 Jena
<xavier.ti...@dlr.de>


2018-03-23 15:12 GMT+01:00 Dayana Muñoz <dayanaa...@hotmail.com>:

> He tratado de usar lo siguiente:
>
> a<- ifelse(BD$División>=50 &  BD$División<59,"D",
>  ifelse (BD$División>=60  &  BD$División<=69,"G",
>  ifelse (BD$División>=70  &
> BD$División<=79,"L",
>  ifelse (BD$División>=80  &
> BD$División<=89,"M",
>  ifelse (BD$División>=90
> &  BD$División<=99,"N","Z")))))
>
>
>
> Pero me arroja puros NA como resultado.
>
>
>
>
> 
> De: Javier Marcuzzi <javier.ruben.marcu...@gmail.com>
> Enviado: viernes, 23 de marzo de 2018 11:04:16
> Para: Dayana Muñoz
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Ayuda con R-Studio condiciones
>
> Estimada Dayana Muñoz
>
> Separemos el problema en dos, la primer parte es la condición, para esto
> puede utilizar la forma que le resulte más apropiada, la segunda parte es
> utilizar por ejemplo cbind al data.frame original, en otras palabras a los
> datos les pega el resultado de la condición en una nueva columna.
>
> Javier Rubén Marcuzzi
>
> El 23 de marzo de 2018, 10:54, Dayana Muñoz <dayanaa...@hotmail.com<
> mailto:dayanaa...@hotmail.com>> escribió:
> Estimados,
>
>
> Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> que tengo: Tengo una base de datos llamada "BD", la cuál posee 300 columnas
> y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva columna
> (adicional), llamada "SECCION" que me clasifique con letras los valores
> numéricos que tengo en la columna "DIVISION":
>
>
> ID  TAMAÑO x
> DIVISION  GRUPOCLASE
>
>
>
>
>
> Grande
>
> 2
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
>
>
>
> Mediana
>
> 2
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 1
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 1
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
>
>
>
> Grande
>
> 3
>
>
>
>
>
>
>
>
> Por ejemplo:
>
>
> Quiero que me clasifique en la nueva columna llamada SECCION, todas las
> divisiones de 50 a 59 con la letra D, de 60 a 69 con la letra G, las de 70
> a 79 con la letra L, las de 80 a 89 con la letra M, las de 90 a 99 con la
> letra N, de tal forma de conseguir esto:
>
>
>
> ID  TAMAÑO  X   DIVISIONGRUPO   CLASE   SECCION
>
>
> Grande
>
> 2
>
>
>
>
>
>
> M
>
>
> Grande
>
> 3
>
>
>
>
>
>
> D
>
>
> Mediana
>
> 2
>
>
>
>
>
>
> N
>
>
> Grande
>
> 1
>
>
>
>
>
>
> G
>
>
> Grande
>
> 3
>
>
>
>
>
>
> L
>
>
> Grande
>
> 3
>
>
>
>
>
>
> L
>
>
> Grande
>
> 1
>
>
>
>
>
>
> L
>
>
> Grande
>
> 3
>
>
>
>
>
>
> L
>
>
> Grande
>
> 3
>
>
>
>
>
>
> G
>
>
> Grande
>
> 3
>
>
>
>
>
>
> L
>
>
> Agradeceré mucho si alguien me pueda orientar en como conseguir esta nueva
> columna
>
> Saludos!
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org<mailto:R-help-es@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Por tema Javier Marcuzzi
Estimada Dayana Muñoz

Separemos el problema en dos, la primer parte es la condición, para esto
puede utilizar la forma que le resulte más apropiada, la segunda parte es
utilizar por ejemplo cbind al data.frame original, en otras palabras a los
datos les pega el resultado de la condición en una nueva columna.

Javier Rubén Marcuzzi

El 23 de marzo de 2018, 10:54, Dayana Muñoz 
escribió:

> Estimados,
>
>
> Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> que tengo: Tengo una base de datos llamada "BD", la cuál posee 300 columnas
> y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva columna
> (adicional), llamada "SECCION" que me clasifique con letras los valores
> numéricos que tengo en la columna "DIVISION":
>
>
> ID  TAMAÑO x
> DIVISION  GRUPOCLASE
>
> 338576
>
>
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
>
> 338421
>
>
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
>
> 352821
>
>
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
>
> 340936
>
>
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
>
> 340937
>
>
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
>
> 340938
>
>
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
>
> 353517
>
>
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
>
> 340940
>
>
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
>
> 340941
>
>
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
>
> 340942
>
>
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
>
>
> Por ejemplo:
>
>
> Quiero que me clasifique en la nueva columna llamada SECCION, todas las
> divisiones de 50 a 59 con la letra D, de 60 a 69 con la letra G, las de 70
> a 79 con la letra L, las de 80 a 89 con la letra M, las de 90 a 99 con la
> letra N, de tal forma de conseguir esto:
>
>
>
> ID  TAMAÑO  X   DIVISIONGRUPO   CLASE   SECCION
> 338576
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
> M
> 338421
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
> D
> 352821
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
> N
> 340936
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
> G
> 340937
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
> L
> 340938
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
> L
> 353517
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
> L
> 340940
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
> L
> 340941
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
> G
> 340942
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
> L
>
>
> Agradeceré mucho si alguien me pueda orientar en como conseguir esta nueva
> columna
>
> Saludos!
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Por tema Carlos Ortega
Hola,

Mira la función "ifelse()" que te ayudará con esto...

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 23 de marzo de 2018, 14:54, Dayana Muñoz 
escribió:

> Estimados,
>
>
> Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> que tengo: Tengo una base de datos llamada "BD", la cuál posee 300 columnas
> y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva columna
> (adicional), llamada "SECCION" que me clasifique con letras los valores
> numéricos que tengo en la columna "DIVISION":
>
>
> ID  TAMAÑO x
> DIVISION  GRUPOCLASE
>
> 338576
>
>
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
>
> 338421
>
>
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
>
> 352821
>
>
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
>
> 340936
>
>
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
>
> 340937
>
>
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
>
> 340938
>
>
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
>
> 353517
>
>
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
>
> 340940
>
>
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
>
> 340941
>
>
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
>
> 340942
>
>
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
>
>
> Por ejemplo:
>
>
> Quiero que me clasifique en la nueva columna llamada SECCION, todas las
> divisiones de 50 a 59 con la letra D, de 60 a 69 con la letra G, las de 70
> a 79 con la letra L, las de 80 a 89 con la letra M, las de 90 a 99 con la
> letra N, de tal forma de conseguir esto:
>
>
>
> ID  TAMAÑO  X   DIVISIONGRUPO   CLASE   SECCION
> 338576
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
> M
> 338421
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
> D
> 352821
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
> N
> 340936
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
> G
> 340937
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
> L
> 340938
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
> L
> 353517
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
> L
> 340940
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
> L
> 340941
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
> G
> 340942
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
> L
>
>
> Agradeceré mucho si alguien me pueda orientar en como conseguir esta nueva
> columna
>
> Saludos!
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda

2018-02-14 Por tema Freddy Omar López Quintero
Holap.

El mié, 14-02-2018 a las 13:41 +0100, Francisco Javier Ibáñez López
escribió:
> Tengo una base de datos con 28 sujetos, a los cuales se les mide un 
> montón de elementos (tengo 27 variables dependientes) en tres
> tiempos 
> distintos (un total de 84 mediciones por variable). Busco comparar
> unas 
> variables con otras.
> 
> ¿Alguien me ayuda con el modelo estadístico a seguir para poder
> analizarlos?

Además de los modelos individuales longitudinales que puedes ajustar
para cada variable dependiente, puedes explorar:

 * Modelos de medidas repetidas para datos multivariantes. Aquí se
evalúa cómo evolucionan p variables respuesta sobre n individuos en t
momentos diferentes. Son modelos intermedios entre MANOVAs y modelos de
curvas de crecimiento. La §6.9 del clásico Johnson & Wichern (2007)
está dedicado a esto y R cuenta con la función manova() en la base.
 * Parecido a lo anterior, pero cuando la respuesta no es normal
(continua) hay modelos generalizados multivariantes para alcanzar lo
mismo, aunque no he visto un modelo de estos manejando tantas variables
respuestas (27) como en tu caso. Hubo un paquete de nombre sabreR (http
://www.sabre.lancs.ac.uk/sabreRuse_intro.html) que servía para estos
menesteres. Como estoy desactualizado y estoy viendo que ya no existe
en CRAN, alguien más seguramente te dará el nombre de un paquete vivo
para hacer esto.

Ahora, un posible problema que puedas tener, es que tienes más o menos
la misma cantidad de variables que de individuos, y cualquier matriz de
covarianza que calcules, si la puedes calcular, será inestable y poco
convincente. Cuenta la leyenda que regularizando (modelos lasso y
relacionados) puedes sacarle provecho. Si lo haces, podrías
compartirnos luego cómo jeje.

Ojalá sirva de algo.

¡Salud!


-- 
«...homines autem hominum causa esse generatos...»

Cicero
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda

2018-02-14 Por tema Francisco Javier Ibáñez López
Gracias Javier Rubén, muy amable.

Echaré un vistazo.

Saludos,


El 14/02/18 a las 13:51, Javier Marcuzzi escribió:
> Estimado Francisco Javier Ibáñes López
>
> Puede utilizar un ejemplo de lme4 o nlme, hay algunos sobre 
> trabajador, máquina, y le agregan algunas cosas mezclando y 
> complicando el modelo, no recuerdo bien en que libro leí estos o si 
> eran dentro de las ayudas públicas. Algo que puede ser importante es 
> variable_a + variable_b, contra variable_a * variable_b, pero bueno, 
> eso está en los manuales de la librería que desee utilizar.
>
> Javier Rubén Marcuzzi
>
> El 14 de febrero de 2018, 9:41, Francisco Javier Ibáñez López 
> > escribió:
>
> Buenos días a tod@s,
>
> Tengo una base de datos con 28 sujetos, a los cuales se les mide
> un montón de elementos (tengo 27 variables dependientes) en tres
> tiempos distintos (un total de 84 mediciones por variable). Busco
> comparar unas variables con otras.
>
> ¿Alguien me ayuda con el modelo estadístico a seguir para poder
> analizarlos?
>
> Gracias por todo.
>
> Saludos,
>
> Fran
>
> -- 
> Francisco Javier Ibáñez López
> Sección de Apoyo Estadístico
> Servicio de Apoyo a la Investigación
> Universidad de Murcia
> Email: f...@um.es 
> Telf.: 868 88 7315; Fax: 868 88 7302
> Edificio SACE, Campus de Espinardo, 30100
> Murcia
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org 
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 
>
>

-- 
Francisco Javier Ibáñez López
Sección de Apoyo Estadístico
Servicio de Apoyo a la Investigación
Universidad de Murcia
Email: f...@um.es
Telf.: 868 88 7315; Fax: 868 88 7302
Edificio SACE, Campus de Espinardo, 30100
Murcia


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda

2018-02-14 Por tema Javier Marcuzzi
Estimado Francisco Javier Ibáñes López

Puede utilizar un ejemplo de lme4 o nlme, hay algunos sobre trabajador,
máquina, y le agregan algunas cosas mezclando y complicando el modelo, no
recuerdo bien en que libro leí estos o si eran dentro de las ayudas
públicas. Algo que puede ser importante es variable_a + variable_b, contra
variable_a * variable_b, pero bueno, eso está en los manuales de la
librería que desee utilizar.

Javier Rubén Marcuzzi

El 14 de febrero de 2018, 9:41, Francisco Javier Ibáñez López 
escribió:

> Buenos días a tod@s,
>
> Tengo una base de datos con 28 sujetos, a los cuales se les mide un montón
> de elementos (tengo 27 variables dependientes) en tres tiempos distintos
> (un total de 84 mediciones por variable). Busco comparar unas variables con
> otras.
>
> ¿Alguien me ayuda con el modelo estadístico a seguir para poder
> analizarlos?
>
> Gracias por todo.
>
> Saludos,
>
> Fran
>
> --
> Francisco Javier Ibáñez López
> Sección de Apoyo Estadístico
> Servicio de Apoyo a la Investigación
> Universidad de Murcia
> Email: f...@um.es
> Telf.: 868 88 7315; Fax: 868 88 7302
> Edificio SACE, Campus de Espinardo, 30100
> Murcia
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda OVER_QUERY_LIMIT

2018-02-09 Por tema Francisco Rodriguez Sanchez

Hola David,

En mi experiencia la función geocode de ggmap suele dar ese problema, 
incluso haciendo sólo unos pocos intentos.


Hay muchos otros paquetes para hacer geocodificación, por ejemplo: 
https://www.r-pkg.org/search.html?q=geocode y 
https://www.rdocumentation.org/search?q=geocode


Por ejemplo dismo::geocode suele funcionar muy bien

Suerte

Paco


El 07/02/2018 a las 21:36, David Contreras escribió:

Buena tarde a todos,

Estos realizando un proceso que requiere asignar coordenadas a un buen
número de registros. Estoy usando el paquete ggmap, pero luego de hacer uso
de la georeferenciación se genera el error "geocode failed with status
OVER_QUERY_LIMIT" debido al límite de registros diarios. A pesar de decir
el error que es cada día, ya me está generando error con pocos registros
incluso sin completar los 2500 del día.
En general la georeferenciación sirve de manera intermitente, es decir a
veces sirve y a veces no.

Nos gustaría si hay alguna forma de evitar que se genere este error sin
tener que pagar dinero por la licencia de API.

Gracias.




*David Contreras*

Estadístico.
davidcontrera...@gmail.com 

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


--
Dr Francisco Rodriguez-Sanchez
Integrative Ecology Group
Estacion Biologica de Doñana (CSIC)
Avda. Americo Vespucio 26
E-41092 Sevilla (Spain)
http://bit.ly/frod_san

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda OVER_QUERY_LIMIT

2018-02-08 Por tema David Contreras
Muchas gracias Javier como siempre por tu ayuda, en este momento el tema de
presupuesto es algo complicado. Pero si tienes toda la razón con los
comentarios.










*David Contreras*

Estadístico

Móvil 3124345188.  <%2B57%20%281%29%204841410%20Ext.%20257>
davidcontrera...@gmail.com 

El 7 de febrero de 2018, 21:58, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimado David Contreras
>
> Hay dos formas, si tienes el dinero o si no tienes el dinero.
>
> Si no tienes el dinero, no te preocupes, aparentemente la API le deja leer
> algunos registros diarios, entonces todos los días puedes leer algunos y
> guardarlos.
>
> Si tienes el dinero te puedo comentar que es lindo que nos abonen por
> nuestro trabajo.
>
> Yo antes intentaba ahorrar todo lo que podía, pero la realidad era que
> gastaba mucho tiempo y no andaba bien, luego comencé a pagar dentro de mis
> posibilidades, y me di cuenta que ahorraba tiempo y mi tiempo también
> cuesta.
>
> Javier Rubén Marcuzzi
>
> El 7 de febrero de 2018, 17:36, David Contreras <
> davidcontrera...@gmail.com> escribió:
>
>> Buena tarde a todos,
>>
>> Estos realizando un proceso que requiere asignar coordenadas a un buen
>> número de registros. Estoy usando el paquete ggmap, pero luego de hacer
>> uso
>> de la georeferenciación se genera el error "geocode failed with status
>> OVER_QUERY_LIMIT" debido al límite de registros diarios. A pesar de decir
>> el error que es cada día, ya me está generando error con pocos registros
>> incluso sin completar los 2500 del día.
>> En general la georeferenciación sirve de manera intermitente, es decir a
>> veces sirve y a veces no.
>>
>> Nos gustaría si hay alguna forma de evitar que se genere este error sin
>> tener que pagar dinero por la licencia de API.
>>
>> Gracias.
>>
>>
>>
>>
>> *David Contreras*
>>
>> Estadístico.
>> davidcontrera...@gmail.com 
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda OVER_QUERY_LIMIT

2018-02-08 Por tema miguel.angel.rodriguez.muinos
Hola David.

Acabo de encontrar dónde habla de las limitaciones.
https://developers.google.com/maps/documentation/geocoding/usage-limits?hl=es-419

Fíjate que son 2500 solicitudes gratuitas por día y un máximo de 50 
"solicitudes" por segundo (se cuentan tanto las peticiones del cliente como las 
del servidor).

Un Saludo,
Miguel






De: R-help-es <r-help-es-boun...@r-project.org> en nombre de Rodríguez Muíños, 
Miguel Ángel
Enviado: jueves, 8 de febrero de 2018 10:16
Para: davidcontrera...@gmail.com; r-help-es@r-project.org
Asunto: Re: [R-es] Ayuda OVER_QUERY_LIMIT

Hola David.

Además de los registros que puedes procesar diariamente, debes controlar la 
"velocidad" con la que los envías para geocodificar. La API (gratuita) no 
admite envíos masivos de datos. Si pruebas a hacerlo manualmente (uno a uno) 
verás que funciona sin problema.

Yo he tenido algún problema similar y lo he solucionado enlentenciendo el 
proceso
Puedes meterle un contador. Como sólo puedes procesar 2500/dia, tienes margen 
para "separarlos en el tiempo".

Espero que con esto resuelvas el problema.


Un Saludo,
--
Miguel Ángel Rodríguez Muíños
Dirección Xeral de Saúde Pública
Consellería de Sanidade
Xunta de Galicia
http://dxsp.sergas.es







De: R-help-es <r-help-es-boun...@r-project.org> en nombre de David Contreras 
<davidcontrera...@gmail.com>
Enviado: miércoles, 7 de febrero de 2018 21:36
Para: r-help-es
Asunto: [R-es] Ayuda OVER_QUERY_LIMIT

Buena tarde a todos,

Estos realizando un proceso que requiere asignar coordenadas a un buen
número de registros. Estoy usando el paquete ggmap, pero luego de hacer uso
de la georeferenciación se genera el error "geocode failed with status
OVER_QUERY_LIMIT" debido al límite de registros diarios. A pesar de decir
el error que es cada día, ya me está generando error con pocos registros
incluso sin completar los 2500 del día.
En general la georeferenciación sirve de manera intermitente, es decir a
veces sirve y a veces no.

Nos gustaría si hay alguna forma de evitar que se genere este error sin
tener que pagar dinero por la licencia de API.

Gracias.




*David Contreras*

Estadístico.
davidcontrera...@gmail.com <cpa...@contratista.icfes.gov.co>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Nota: A información contida nesta mensaxe e os seus posibles documentos 
adxuntos é privada e confidencial e está dirixida únicamente ó seu 
destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por 
favor elimínea. A distribución ou copia desta mensaxe non está autorizada.

Nota: La información contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y está dirigida únicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elimínelo. La distribución o copia de este mensaje no está autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Nota: A información contida nesta mensaxe e os seus posibles documentos 
adxuntos é privada e confidencial e está dirixida únicamente ó seu 
destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por 
favor elimínea. A distribución ou copia desta mensaxe non está autorizada.

Nota: La información contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y está dirigida únicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elimínelo. La distribución o copia de este mensaje no está autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda OVER_QUERY_LIMIT

2018-02-08 Por tema miguel.angel.rodriguez.muinos
Hola David.

Además de los registros que puedes procesar diariamente, debes controlar la 
"velocidad" con la que los envías para geocodificar. La API (gratuita) no 
admite envíos masivos de datos. Si pruebas a hacerlo manualmente (uno a uno) 
verás que funciona sin problema.

Yo he tenido algún problema similar y lo he solucionado enlentenciendo el 
proceso
Puedes meterle un contador. Como sólo puedes procesar 2500/dia, tienes margen 
para "separarlos en el tiempo".

Espero que con esto resuelvas el problema.


Un Saludo,
--
Miguel Ángel Rodríguez Muíños
Dirección Xeral de Saúde Pública
Consellería de Sanidade
Xunta de Galicia
http://dxsp.sergas.es







De: R-help-es  en nombre de David Contreras 

Enviado: miércoles, 7 de febrero de 2018 21:36
Para: r-help-es
Asunto: [R-es] Ayuda OVER_QUERY_LIMIT

Buena tarde a todos,

Estos realizando un proceso que requiere asignar coordenadas a un buen
número de registros. Estoy usando el paquete ggmap, pero luego de hacer uso
de la georeferenciación se genera el error "geocode failed with status
OVER_QUERY_LIMIT" debido al límite de registros diarios. A pesar de decir
el error que es cada día, ya me está generando error con pocos registros
incluso sin completar los 2500 del día.
En general la georeferenciación sirve de manera intermitente, es decir a
veces sirve y a veces no.

Nos gustaría si hay alguna forma de evitar que se genere este error sin
tener que pagar dinero por la licencia de API.

Gracias.




*David Contreras*

Estadístico.
davidcontrera...@gmail.com 

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Nota: A información contida nesta mensaxe e os seus posibles documentos 
adxuntos é privada e confidencial e está dirixida únicamente ó seu 
destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por 
favor elimínea. A distribución ou copia desta mensaxe non está autorizada.

Nota: La información contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y está dirigida únicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elimínelo. La distribución o copia de este mensaje no está autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda OVER_QUERY_LIMIT

2018-02-07 Por tema Javier Marcuzzi
Estimado David Contreras

Hay dos formas, si tienes el dinero o si no tienes el dinero.

Si no tienes el dinero, no te preocupes, aparentemente la API le deja leer
algunos registros diarios, entonces todos los días puedes leer algunos y
guardarlos.

Si tienes el dinero te puedo comentar que es lindo que nos abonen por
nuestro trabajo.

Yo antes intentaba ahorrar todo lo que podía, pero la realidad era que
gastaba mucho tiempo y no andaba bien, luego comencé a pagar dentro de mis
posibilidades, y me di cuenta que ahorraba tiempo y mi tiempo también
cuesta.

Javier Rubén Marcuzzi

El 7 de febrero de 2018, 17:36, David Contreras 
escribió:

> Buena tarde a todos,
>
> Estos realizando un proceso que requiere asignar coordenadas a un buen
> número de registros. Estoy usando el paquete ggmap, pero luego de hacer uso
> de la georeferenciación se genera el error "geocode failed with status
> OVER_QUERY_LIMIT" debido al límite de registros diarios. A pesar de decir
> el error que es cada día, ya me está generando error con pocos registros
> incluso sin completar los 2500 del día.
> En general la georeferenciación sirve de manera intermitente, es decir a
> veces sirve y a veces no.
>
> Nos gustaría si hay alguna forma de evitar que se genere este error sin
> tener que pagar dinero por la licencia de API.
>
> Gracias.
>
>
>
>
> *David Contreras*
>
> Estadístico.
> davidcontrera...@gmail.com 
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda R no puede hubicar un vector de 42gb

2017-06-22 Por tema Ursula Jacobo Arteaga via R-help-es
Te agradezco Carlos...
saludos


 
 
  El jue., 22 de jun de 2017 a la(s) 5:02 p.m., Carlos 
Ortega escribió:   En IBM tenéis esto...:
https://datascience.ibm.com/

Al que también recientemente habéis incorporado H2O:
https://www.hpcwire.com/off-the-wire/h2o-ai-partners-ibm-bring-enterprise-ai-ibm-power-systems/

Saludos,Carlos Ortegawww.qualityexcellence.es
El 22 de junio de 2017, 23:11, Carlos Ortega  
escribió:

http://go.cloudera.com/ml-h20- es-webinar?src=email1& elqTrackId= 
af5517eab2f543afbb31a0686d9ca5 66= c68d9a8c25ba4b12944b8065d8a06e 
33=4541=1& elqCampaignId=

El 22 de junio de 2017, 22:59, Carlos Ortega  
escribió:

Hola,
Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees algo te 
lo estás llevando a este nodo frontera que tiene que tener memoria suficiente 
para poder leer el fichero que quieres. El que digas que tienes 256Gb, entiendo 
que es repartidos en todo el clúster y no en ese nodo frontera.
La forma de trabajar no es esta. La idea es que proceses tus datos de forma 
distribuida, desde el nodo frontera diriges/distribuyes el trabajo a todos los 
nodos. Una forma que el propio Cloudera recomienda para este tipo de 
procesamiento analítico es usar H2O. Con H2O al leer el fichero haces una 
lectura distribuida, al igual que si realizas cualquier tipo de análisis 
(modelización) lo haces de forma distribuida (en todos tus nodos).
Otra alternativa que también recomienda Cloudera es utilizar RStudio con 
"sparklyr" y realizar el procesamiento en Spark. Mira el detalles en la página 
que tiene RStudio de este paquete (que están desarrollando ellos mismos).
Si tus datos no son "enormes" puedes perfectamente probar a trabajar sobre una 
máquina con mucha RAM y te ahorras todas estas complicaciones.
Saludos,Carlos Ortegawww.qualityexcellence.es
El 22 de junio de 2017, 21:33, Ursula Jacobo Arteaga via R-help-es 
 escribió:

hola, estoy trabajando en cloudera con RStudio server y constantemente "muere"  
R por el tamaño de los archivos que lee. Supuestamente tengo 256gb de memoria 
pero con archivos de 42gb muere con sólo leerlos,Amguien tiene una idea de cómo 
trabajar con este volumen de info?saludos y gracias



        [[alternative HTML version deleted]]

__ _
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/l istinfo/r-help-es




-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es  

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda R no puede hubicar un vector de 42gb

2017-06-22 Por tema javier.ruben.marcuzzi
Estimada Ursula Jacobo Arteaga

Hay una posibilidad con Windows azure, yo había realizado un curso al respecto, 
aunque habría que ver la denominación de ese servicio desde que lo integraron a 
sql server. Pero a esa cantidad de datos casi seguro que hay costos.

Javier Rubén Marcuzzi

De: Ursula Jacobo Arteaga via R-help-es
Enviado: jueves, 22 de junio de 2017 16:33
Para: r-help-es@r-project.org
Asunto: [R-es] Ayuda R no puede hubicar un vector de 42gb

hola, estoy trabajando en cloudera con RStudio server y constantemente "muere"  
R por el tamaño de los archivos que lee. Supuestamente tengo 256gb de memoria 
pero con archivos de 42gb muere con sólo leerlos,Amguien tiene una idea de cómo 
trabajar con este volumen de info?saludos y gracias



[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda R no puede hubicar un vector de 42gb

2017-06-22 Por tema Carlos Ortega
En IBM tenéis esto...:

https://datascience.ibm.com/

Al que también recientemente habéis incorporado H2O:

https://www.hpcwire.com/off-the-wire/h2o-ai-partners-ibm-bring-enterprise-ai-ibm-power-systems/

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 22 de junio de 2017, 23:11, Carlos Ortega 
escribió:

> http://go.cloudera.com/ml-h20-es-webinar?src=email1=
> af5517eab2f543afbb31a0686d9ca566=c68d9a8c25ba4b12944b8065d8a06e
> 33=4541=1=
>
> El 22 de junio de 2017, 22:59, Carlos Ortega 
> escribió:
>
>> Hola,
>>
>> Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees
>> algo te lo estás llevando a este nodo frontera que tiene que tener memoria
>> suficiente para poder leer el fichero que quieres. El que digas que tienes
>> 256Gb, entiendo que es repartidos en todo el clúster y no en ese nodo
>> frontera.
>>
>> La forma de trabajar no es esta. La idea es que proceses tus datos de
>> forma distribuida, desde el nodo frontera diriges/distribuyes el trabajo a
>> todos los nodos. Una forma que el propio Cloudera recomienda para este tipo
>> de procesamiento analítico es usar H2O. Con H2O al leer el fichero haces
>> una lectura distribuida, al igual que si realizas cualquier tipo de
>> análisis (modelización) lo haces de forma distribuida (en todos tus nodos).
>>
>> Otra alternativa que también recomienda Cloudera es utilizar RStudio con
>> "sparklyr" y realizar el procesamiento en Spark. Mira el detalles en la
>> página que tiene RStudio de este paquete (que están desarrollando ellos
>> mismos).
>>
>> Si tus datos no son "enormes" puedes perfectamente probar a trabajar
>> sobre una máquina con mucha RAM y te ahorras todas estas complicaciones.
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 22 de junio de 2017, 21:33, Ursula Jacobo Arteaga via R-help-es <
>> r-help-es@r-project.org> escribió:
>>
>>> hola, estoy trabajando en cloudera con RStudio server y constantemente
>>> "muere"  R por el tamaño de los archivos que lee. Supuestamente tengo 256gb
>>> de memoria pero con archivos de 42gb muere con sólo leerlos,Amguien tiene
>>> una idea de cómo trabajar con este volumen de info?saludos y gracias
>>>
>>>
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda R no puede hubicar un vector de 42gb

2017-06-22 Por tema Carlos Ortega
http://go.cloudera.com/ml-h20-es-webinar?src=email1=af5517eab2f543afbb31a0686d9ca566=c68d9a8c25ba4b12944b8065d8a06e33=4541=1=

El 22 de junio de 2017, 22:59, Carlos Ortega 
escribió:

> Hola,
>
> Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees
> algo te lo estás llevando a este nodo frontera que tiene que tener memoria
> suficiente para poder leer el fichero que quieres. El que digas que tienes
> 256Gb, entiendo que es repartidos en todo el clúster y no en ese nodo
> frontera.
>
> La forma de trabajar no es esta. La idea es que proceses tus datos de
> forma distribuida, desde el nodo frontera diriges/distribuyes el trabajo a
> todos los nodos. Una forma que el propio Cloudera recomienda para este tipo
> de procesamiento analítico es usar H2O. Con H2O al leer el fichero haces
> una lectura distribuida, al igual que si realizas cualquier tipo de
> análisis (modelización) lo haces de forma distribuida (en todos tus nodos).
>
> Otra alternativa que también recomienda Cloudera es utilizar RStudio con
> "sparklyr" y realizar el procesamiento en Spark. Mira el detalles en la
> página que tiene RStudio de este paquete (que están desarrollando ellos
> mismos).
>
> Si tus datos no son "enormes" puedes perfectamente probar a trabajar sobre
> una máquina con mucha RAM y te ahorras todas estas complicaciones.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 22 de junio de 2017, 21:33, Ursula Jacobo Arteaga via R-help-es <
> r-help-es@r-project.org> escribió:
>
>> hola, estoy trabajando en cloudera con RStudio server y constantemente
>> "muere"  R por el tamaño de los archivos que lee. Supuestamente tengo 256gb
>> de memoria pero con archivos de 42gb muere con sólo leerlos,Amguien tiene
>> una idea de cómo trabajar con este volumen de info?saludos y gracias
>>
>>
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda

2017-03-23 Por tema Víctor Granda García
Hola!

Como te dice Isidro, es con la opción row.names = FALSE:

*write.csv(objeto, 'nombre_archivo.csv', row.names = FALSE)*

También puedes usar el paquete readr (el que usa por defecto RStudio al
cargar desde la IDE) con la orden write_csv (nota que la diferencia es un
guión bajo en vez de un punto). Esta orden por defecto ya no incluye los
identificadores de fila.

Un saludo!

El jue., 23 mar. 2017 a las 14:36, <javier.ruben.marcu...@gmail.com>
escribió:

> Estimados
>
> ¿Los datos están en una lista o en un data.frame? Yo a eso lo supe hacer
> pero desde un data.frame a csv, lógicamente hay mucho gusto personal,
> técnicamente no debería haber inconvenientes.
>
> Javier Rubén Marcuzzi
>
> De: Isidro Hidalgo Arellano
> Enviado: jueves, 23 de marzo de 2017 10:19
> Para: r-help-es@r-project.org
> Asunto: Re: [R-es] ayuda
>
> Si no recuerdo mal, la función "write.csv" con la opción "row.names =
> FALSE"...
> Un saludo
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo
> http://www.castillalamancha.es/
>
>
>
> -Mensaje original-
> De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de
> jbetanco...@iscmc.cmw.sld.cu
> Enviado el: jueves, 23 de marzo de 2017 14:25
> Para: R-help-es@r-project.org
> Asunto: [R-es] ayuda
>
>
> Etimados
>
> Necesito llevar estos valores a un csv, pero exclyendo los numeros de
> orden que aparecen (como ejemplo 1 2 3 4 5
> 6 7...   146   147   148   149 )
> ?cual es el procedimiento en R?
> saludos
> José
>
> adjunto el archivo
>
>   1 2 3 4 5 6 7 8
>910
> 398.25016 314.53157 296.34537 274.23091 427.62972 383.73797 178.22535
> 151.43303 207.88569 294.92665
>11121314151617
>   181920
> 458.43901 333.77029 247.33763 250.22919 242.15343 233.11130 200.47216
> 178.64228 184.01266 204.62766
>21222324252627
>   282930
> 152.62796 164.01995 201.80908 164.01995 149.37300 181.86798 150.27984
> 112.57510 137.63171 124.21796
>31323334353637
>   383940
> 142.83601 134.62039 142.67562 122.13966 143.58783 155.11727 139.84216
> 153.64144 117.31500 124.47451
>41424344454647
>   484950
> 107.67572 118.43388 115.23605 119.32508 151.23043 129.85246  81.66875
> 85.65150  91.16870  72.08812
>51525354555657
>   585960
>  97.55867  97.24828  81.93495  74.73000  78.12502  73.16366  67.80174
> 87.58946  61.31594  68.23062
>61626364656667
>   686970
>  63.28966  66.80050  71.93468  67.58145  60.80083  74.72494  66.23932
> 86.92940  69.02829  62.85628
>71727374757677
>   787980
>  43.34396  61.39229  50.15910  59.53365  46.28320  32.60935  30.02753
> 31.55693  32.71343  32.71343
>81828384858687
>   888990
>  31.75869  32.50560  30.37858  31.79439  35.43730  35.51049  36.50262
> 35.73753  35.51049  40.10461
>91929394959697
>   9899   100
>  38.60708  34.95254  38.77044  40.10847  28.88173  29.31264  28.39851
> 28.27637  29.53321  35.18463
>   101   102   103   104   105   106   107
>  108   109   110
>  37.09471  35.52260  37.25494  36.12705  33.65564  37.05306  35.36983
> 33.61785  28.1  26.51693
>   111   112   113   114   115   116   117
>  118   119   120
>  26.96814  23.82963  24.83296  24.99173  23.78052  24.00732  22.69869
> 23.57915  22.55449  22.26882
>   121   122   123   124   125   126   127
>  128   129   130
>  22.19797  18.76223  21.18957  19.32626  22.15372  20.24736  21.30254
> 20.44185  19.84526  20.24736
>   131   132   133   134   135   136   137
>  138   139   140
>  20.92261  20.61504  21.09986  23.32052  19.00811  17.42788  18.12424
> 17.89469  18.94764  18.31554
>   141   142   143   144   145   146   147
>  148   149
>  18.47071  18.60970  17.31717  17.48351  14.47412  14.10979  14.67357
> 14.59674  14.78399
>
>

Re: [R-es] ayuda

2017-03-23 Por tema javier.ruben.marcuzzi
Estimados

¿Los datos están en una lista o en un data.frame? Yo a eso lo supe hacer pero 
desde un data.frame a csv, lógicamente hay mucho gusto personal, técnicamente 
no debería haber inconvenientes.

Javier Rubén Marcuzzi

De: Isidro Hidalgo Arellano
Enviado: jueves, 23 de marzo de 2017 10:19
Para: r-help-es@r-project.org
Asunto: Re: [R-es] ayuda

Si no recuerdo mal, la función "write.csv" con la opción "row.names =
FALSE"...
Un saludo

Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
http://www.castillalamancha.es/



-Mensaje original-
De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de
jbetanco...@iscmc.cmw.sld.cu
Enviado el: jueves, 23 de marzo de 2017 14:25
Para: R-help-es@r-project.org
Asunto: [R-es] ayuda


Etimados

Necesito llevar estos valores a un csv, pero exclyendo los numeros de
orden que aparecen (como ejemplo 1 2 3 4 5
6 7...   146   147   148   149 )
?cual es el procedimiento en R?
saludos
José

adjunto el archivo

  1 2 3 4 5 6 7 8 
   910
398.25016 314.53157 296.34537 274.23091 427.62972 383.73797 178.22535
151.43303 207.88569 294.92665
   11121314151617 
  181920
458.43901 333.77029 247.33763 250.22919 242.15343 233.11130 200.47216
178.64228 184.01266 204.62766
   21222324252627 
  282930
152.62796 164.01995 201.80908 164.01995 149.37300 181.86798 150.27984
112.57510 137.63171 124.21796
   31323334353637 
  383940
142.83601 134.62039 142.67562 122.13966 143.58783 155.11727 139.84216
153.64144 117.31500 124.47451
   41424344454647 
  484950
107.67572 118.43388 115.23605 119.32508 151.23043 129.85246  81.66875 
85.65150  91.16870  72.08812
   51525354555657 
  585960
 97.55867  97.24828  81.93495  74.73000  78.12502  73.16366  67.80174 
87.58946  61.31594  68.23062
   61626364656667 
  686970
 63.28966  66.80050  71.93468  67.58145  60.80083  74.72494  66.23932 
86.92940  69.02829  62.85628
   71727374757677 
  787980
 43.34396  61.39229  50.15910  59.53365  46.28320  32.60935  30.02753 
31.55693  32.71343  32.71343
   81828384858687 
  888990
 31.75869  32.50560  30.37858  31.79439  35.43730  35.51049  36.50262 
35.73753  35.51049  40.10461
   91929394959697 
  9899   100
 38.60708  34.95254  38.77044  40.10847  28.88173  29.31264  28.39851 
28.27637  29.53321  35.18463
  101   102   103   104   105   106   107 
 108   109   110
 37.09471  35.52260  37.25494  36.12705  33.65564  37.05306  35.36983 
33.61785  28.1  26.51693
  111   112   113   114   115   116   117 
 118   119   120
 26.96814  23.82963  24.83296  24.99173  23.78052  24.00732  22.69869 
23.57915  22.55449  22.26882
  121   122   123   124   125   126   127 
 128   129   130
 22.19797  18.76223  21.18957  19.32626  22.15372  20.24736  21.30254 
20.44185  19.84526  20.24736
  131   132   133   134   135   136   137 
 138   139   140
 20.92261  20.61504  21.09986  23.32052  19.00811  17.42788  18.12424 
17.89469  18.94764  18.31554
  141   142   143   144   145   146   147 
 148   149
 18.47071  18.60970  17.31717  17.48351  14.47412  14.10979  14.67357 
14.59674  14.78399

--
Este mensaje le ha llegado mediante el servicio de correo electronico que
ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
Nacional de Salud. La persona que envia este correo asume el compromiso de
usar el servicio a tales fines y cumplir con las regulaciones establecidas

Infomed: http://www.sld.cu/

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda

2017-03-23 Por tema Isidro Hidalgo Arellano
Si no recuerdo mal, la función "write.csv" con la opción "row.names =
FALSE"...
Un saludo

Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
http://www.castillalamancha.es/



-Mensaje original-
De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de
jbetanco...@iscmc.cmw.sld.cu
Enviado el: jueves, 23 de marzo de 2017 14:25
Para: R-help-es@r-project.org
Asunto: [R-es] ayuda


Etimados

Necesito llevar estos valores a un csv, pero exclyendo los numeros de
orden que aparecen (como ejemplo 1 2 3 4 5
6 7...   146   147   148   149 )
?cual es el procedimiento en R?
saludos
José

adjunto el archivo

  1 2 3 4 5 6 7 8 
   910
398.25016 314.53157 296.34537 274.23091 427.62972 383.73797 178.22535
151.43303 207.88569 294.92665
   11121314151617 
  181920
458.43901 333.77029 247.33763 250.22919 242.15343 233.11130 200.47216
178.64228 184.01266 204.62766
   21222324252627 
  282930
152.62796 164.01995 201.80908 164.01995 149.37300 181.86798 150.27984
112.57510 137.63171 124.21796
   31323334353637 
  383940
142.83601 134.62039 142.67562 122.13966 143.58783 155.11727 139.84216
153.64144 117.31500 124.47451
   41424344454647 
  484950
107.67572 118.43388 115.23605 119.32508 151.23043 129.85246  81.66875 
85.65150  91.16870  72.08812
   51525354555657 
  585960
 97.55867  97.24828  81.93495  74.73000  78.12502  73.16366  67.80174 
87.58946  61.31594  68.23062
   61626364656667 
  686970
 63.28966  66.80050  71.93468  67.58145  60.80083  74.72494  66.23932 
86.92940  69.02829  62.85628
   71727374757677 
  787980
 43.34396  61.39229  50.15910  59.53365  46.28320  32.60935  30.02753 
31.55693  32.71343  32.71343
   81828384858687 
  888990
 31.75869  32.50560  30.37858  31.79439  35.43730  35.51049  36.50262 
35.73753  35.51049  40.10461
   91929394959697 
  9899   100
 38.60708  34.95254  38.77044  40.10847  28.88173  29.31264  28.39851 
28.27637  29.53321  35.18463
  101   102   103   104   105   106   107 
 108   109   110
 37.09471  35.52260  37.25494  36.12705  33.65564  37.05306  35.36983 
33.61785  28.1  26.51693
  111   112   113   114   115   116   117 
 118   119   120
 26.96814  23.82963  24.83296  24.99173  23.78052  24.00732  22.69869 
23.57915  22.55449  22.26882
  121   122   123   124   125   126   127 
 128   129   130
 22.19797  18.76223  21.18957  19.32626  22.15372  20.24736  21.30254 
20.44185  19.84526  20.24736
  131   132   133   134   135   136   137 
 138   139   140
 20.92261  20.61504  21.09986  23.32052  19.00811  17.42788  18.12424 
17.89469  18.94764  18.31554
  141   142   143   144   145   146   147 
 148   149
 18.47071  18.60970  17.31717  17.48351  14.47412  14.10979  14.67357 
14.59674  14.78399

--
Este mensaje le ha llegado mediante el servicio de correo electronico que
ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
Nacional de Salud. La persona que envia este correo asume el compromiso de
usar el servicio a tales fines y cumplir con las regulaciones establecidas

Infomed: http://www.sld.cu/

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con Date

2017-02-16 Por tema Mauricio Monsalvo
Carlos, probé en primer lugar tu propuesta. Pero:
as.data.table(datos)[, .N, by=pprfecbaja]
pprfecbajaN
 1: 0001-01-01 2000
 2: 1994-08-26   20
 3: 2005-07-06  585
 4: 2005-03-07   29
 5: 2004-03-23   33
 6: 2004-10-181
 7: 1997-09-019
 8: 1997-09-04   16
 9: 1996-05-293
...
datos$pprfecbaja <- ymd(datos$pprfecbaja)
Warning message:
 764 failed to parse.
> as.data.table(datos)[, .N, by=pprfecbaja]
pprfecbajaN
 1:2770
 2: 2001-01-059
 3: 2001-01-08   16
 4: 2001-01-077
 5: 2001-09-071
 6: 2001-05-121
 7: 2001-10-221
 8: 2001-12-271
 9: 2001-08-201
10: 2001-03-091
Es decir, ymd() lleva todos los datos a unas fechas que no existen, todas
del año 2001.

Por otro lado, la opción de Gerar:
datos$pprfecbaja<-strptime(datos$pprfecbaja, "%Y-%m-%d")  ##transformar la
variable de formato Character a formato POSIXlt
Warning messages:
1: In `[<-.data.table`(x, j = name, value = value) :
  Supplied 11 items to be assigned to 2808 items of column 'pprfecbaja'
(recycled leaving remainder of 3 items).
2: In `[<-.data.table`(x, j = name, value = value) :
  Coerced 'list' RHS to 'character' to match the column's type. Either
change the target column to 'list' first (by creating a new 'list' vector
length 2808 (nrows of entire table) and assign that; i.e. 'replace'
column), or coerce RHS to 'character' (e.g. 1L, NA_[real|integer]_, as.*,
etc) to make your intent clear and for speed. Or, set the column type
correctly up front when you create the table and stick to it, please.
Da valores raros a las celdas, algo así como (el print sale truncado):
c(NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, ... 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, NA, NA, NA, NA, NA, NA, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)

Finlmente, la opción de Freddy *andó:*
datos$pprfecbaja<-replace(as.Date(datos$pprfecbaja),
datos$pprfecbaja=="0001-01-01", NA)
as.data.table(datos)[, .N, by=pprfecbaja]
 pprfecbajaN
 1:2006
 2: 1994-08-26   20
 3: 2005-07-06  585
 4: 2005-03-07   29
 5: 2004-03-23   33
 6: 2004-10-181
 7: 1997-09-019
 8: 1997-09-04   16
 9: 1996-05-293
10: 1997-09-037

El 16 de febrero de 2017, 12:43, Carlos Ortega 
escribió:

> Hola,
>
> Así funciona...
>
> #
>
> library(lubridate)
> datos <- read.table("datos.csv", header = TRUE, sep = ";", as.is = TRUE)
> #Primero quito fechas malas
> datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
> datos$pprfecbaja)
>
> # Convierto campo fechas en clase Date
> datos$pprfecbaja <- ymd(datos$pprfecbaja)
>
> # Comprobacion de la clase
> tail(datos)
> class(datos$pprfecbaja[2808])
>
> #
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 16 de febrero de 2017, 13:34, Mauricio Monsalvo 
> escribió:
>
>> Hola.
>> Tengo una duda con esta sintaxis. Tengo una variable con formato Date que
>> por algún motivo (el data.table viene de una consulta con PostgreSQL):
>> datos <- prov[, pprid, pprfecbaja]
>>   str(datos)
>> Cuando intento quitar las fechas de bajas inválidas (0001-01-01) y
>> convertirlas a NA, la variable resultante "pierde" su condición de Date.
>> Probé con distintas formas, siempre con el mismo resultado:
>> datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
>> datos$pprfecbaja)
>> datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
>> as.Date(datos$pprfecbaja))
>> datos$pprfecbaja <- ifelse(year(datos$pprfecbaja) < 1994, NA,
>> as.Date(datos$pprfecbaja))
>> ¿Podrían por favor ayudarme a correr la sintaxis correcta?
>> Adjunto los datos de ejemplo.
>> ​Muchas gracias.​
>>
>> --
>> Mauricio
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Mauricio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con Date

2017-02-16 Por tema Mauricio Monsalvo
Excelente!
Muchas gracias a todos!!
Saludos.

El 16 de febrero de 2017, 13:06, Freddy Omar López Quintero <
freddy.lopez.quint...@gmail.com> escribió:

> ​Hola.​
>
> 2017-02-16 9:34 GMT-03:00 Mauricio Monsalvo :
>
>> ¿Podrían por favor ayudarme a correr la sintaxis correcta?
>
>
> Esta es otra opción:
>
> ​datos<-read.csv('datos.csv', sep=';', row.names=1)
>> ​​datos$pprfecbaja<-​ replace(as.Date(datos$pprfecbaja),
>> datos$pprfecbaja=="0001-01-01", NA)
>
>
> ​Saludos.​
>
>
> --
> «Pídeles sus títulos a los que te persiguen, pregúntales
> cuándo nacieron, diles que te demuestren su existencia.»
>
> Rafael Cadenas
>
>


-- 
Mauricio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con Date

2017-02-16 Por tema Freddy Omar López Quintero
​Hola.​

2017-02-16 9:34 GMT-03:00 Mauricio Monsalvo :

> ¿Podrían por favor ayudarme a correr la sintaxis correcta?


Esta es otra opción:

​datos<-read.csv('datos.csv', sep=';', row.names=1)
> ​​datos$pprfecbaja<-​ replace(as.Date(datos$pprfecbaja),
> datos$pprfecbaja=="0001-01-01", NA)


​Saludos.​


-- 
«Pídeles sus títulos a los que te persiguen, pregúntales
cuándo nacieron, diles que te demuestren su existencia.»

Rafael Cadenas

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con Date

2017-02-16 Por tema Carlos Ortega
Hola,

Así funciona...

#

library(lubridate)
datos <- read.table("datos.csv", header = TRUE, sep = ";", as.is = TRUE)
#Primero quito fechas malas
datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
datos$pprfecbaja)

# Convierto campo fechas en clase Date
datos$pprfecbaja <- ymd(datos$pprfecbaja)

# Comprobacion de la clase
tail(datos)
class(datos$pprfecbaja[2808])

#

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 16 de febrero de 2017, 13:34, Mauricio Monsalvo 
escribió:

> Hola.
> Tengo una duda con esta sintaxis. Tengo una variable con formato Date que
> por algún motivo (el data.table viene de una consulta con PostgreSQL):
> datos <- prov[, pprid, pprfecbaja]
>   str(datos)
> Cuando intento quitar las fechas de bajas inválidas (0001-01-01) y
> convertirlas a NA, la variable resultante "pierde" su condición de Date.
> Probé con distintas formas, siempre con el mismo resultado:
> datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
> datos$pprfecbaja)
> datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA,
> as.Date(datos$pprfecbaja))
> datos$pprfecbaja <- ifelse(year(datos$pprfecbaja) < 1994, NA,
> as.Date(datos$pprfecbaja))
> ¿Podrían por favor ayudarme a correr la sintaxis correcta?
> Adjunto los datos de ejemplo.
> ​Muchas gracias.​
>
> --
> Mauricio
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con Date

2017-02-16 Por tema Reverté Calvet , Gerard
Una opción podria ser: datos$pprfecbaja<-as. character(datos$pprfecbaja) ##transformar la variable de formato Date a formato Characterdatos$pprfecbaja[datos$pprfecbaja=="0001-01-01"]<-"-00-00"  #reemplazar la fecha “0001-01-01” por una fecha inexistente “-00-00”datos$pprfecbaja<-strptime(datos$pprfecbaja, "%Y-%m-%d")  ##transformar la variable de formato Character a formato POSIXlt  Gerard Reverté  De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de Mauricio MonsalvoEnviado el: jueves, 16 de febrero de 2017 13:34Para: r-help-esAsunto: [R-es] Ayuda con Date Hola.Tengo una duda con esta sintaxis. Tengo una variable con formato Date que por algún motivo (el data.table viene de una consulta con PostgreSQL):datos <- prov[, pprid, pprfecbaja]  str(datos)Cuando intento quitar las fechas de bajas inválidas (0001-01-01) y convertirlas a NA, la variable resultante "pierde" su condición de Date. Probé con distintas formas, siempre con el mismo resultado:datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA, datos$pprfecbaja)datos$pprfecbaja <- ifelse(datos$pprfecbaja=="0001-01-01", NA, as.Date(datos$pprfecbaja))datos$pprfecbaja <- ifelse(year(datos$pprfecbaja) < 1994, NA, as.Date(datos$pprfecbaja))¿Podrían por favor ayudarme a correr la sintaxis correcta? Adjunto los datos de ejemplo.  ​Muchas gracias.​ -- Mauricio 
Avís legal/Aviso legal
La present informació s'envia únicament a la persona a la que va dirigida i pot contenir informació privilegiada o de caràcter confidencial. Qualsevol modificació, retransmissió, difusió o altre ús d'aquesta informació per persones o entitats diferents a la persona a la que va dirigida està prohibida. Si vostè l'ha rebut per error, si us plau contacti amb el remitent i esborri el missatge de qualsevol ordinador. En el cas que aquest missatge vagi a ser contestat per la mateixa via, ha de saber-se que la seva resposta podria ser coneguda per tercers a l'entrar a la xarxa. Per això, si el missatge inclou contrasenyes, números de targetes de crèdit o qualsevol altra informació que vostè consideri confidencial, seria més segur contestar per una altra via i cancel·lar la seva transmissió. L'Ajuntament de Mataró i els seus organismes dependents no poden assumir la responsabilitat derivada del fet de què terceres persones puguin arribar a conèixer el contingut d'aquest missatge durant la seva transmissió.


La presente información se envía únicamente a la persona a la que va dirigida y puede contener información privilegiada o de carácter confidencial. Cualquier modificación, retransmisión, difusión u otro uso de esta información por persones o entidades diferentes a la persona a la que va dirigida está prohibida. Si usted la ha recibido por error, por favor contacte con el remitente y borre el mensaje. En el caso de que este mensaje vaya a ser contestado por la misma vía, ha de saberse que su respuesta podría ser conocida por terceros al entrar en la red. Por este motivo, si el mensaje incluye contraseñas, números de tarjetas de crédito o cualquier otra información que considere confidencial, sería más seguro contestar por otra vía y cancelar su transmisión. El Ayuntamiento de Mataró y sus organismos dependientes no pueden asumir la responsabilidad derivada del hecho de que terceras personas puedan llegar a conocer el contenido de este mensaje durante su transmisión. 
   ___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] AYUDA TukeyHSD

2017-01-10 Por tema Emilio L. Cano
Hola,

Una forma rápida de convertir todos los nombres de columnas una vez
importados los datos es:

names(nombredeldataframe) <- make.names(names(nombredeldataframe)

Un saludo,
Emilio


El 10 de enero de 2017, 19:51, Carlos J. Gil Bellosta 
escribió:

> Primero, deberías hacer
>
> TukeyHSD(ANOVAGalMan3, "Sample*`Purification-step`",ordered = TRUE)
>
> Segundo, ni eso te va a funcionar. Cambia el nombre de tus columnas para
> que no tengan guiones ni tengas que usar comillas.
>
> Arrastrar nombres con caracteres inválidos es garantía de problemas.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El 10 de enero de 2017, 19:34, Pilar Vilaro 
> escribió:
>
> > Hola,
> > estoy intentando hacer un Tukey post test y no me lo permite.
> > Hice el anova con aov sin problemas, pero al hacer el Tukey, me dice:
> >
> > > TukeyHSD(ANOVAGalMan3,Sample*`Purification-step`,ordered = TRUE)Error
> > in `[.data.frame`(mf, mf.cols[[i]]) : undefined columns selected
> >
> >
> > aclaro que ANOVAGalMan3 es el resultado de anova.
> >
> > la tabla origen tiene la estructura:
> >
> > Sample Purification-step Total-sugar-content Total-protein-content
> > G-M-ratio
> > Prosopis affinis Yo 63,5 4,2 1,4
> >
> > y tiene algunos datos faltantes que aparecen como NA
> >
> > alguno puede ayudarme?
> > muchas gracias saludos
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 

*Emilio López Cano*
Data Scientist

Mobile: +34 665 676 225
skype: emilopezcano
twitter: @emilopezcano
http://emilio.lcano.com

*Affiliations / Collaborations:*
Rey Juan Carlos University
University of Castilla-La Mancha
Comunidad R-Hispano
AEC - AENOR - SKITES - talentyon

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] AYUDA TukeyHSD

2017-01-10 Por tema Carlos J. Gil Bellosta
Primero, deberías hacer

TukeyHSD(ANOVAGalMan3, "Sample*`Purification-step`",ordered = TRUE)

Segundo, ni eso te va a funcionar. Cambia el nombre de tus columnas para
que no tengan guiones ni tengas que usar comillas.

Arrastrar nombres con caracteres inválidos es garantía de problemas.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 10 de enero de 2017, 19:34, Pilar Vilaro 
escribió:

> Hola,
> estoy intentando hacer un Tukey post test y no me lo permite.
> Hice el anova con aov sin problemas, pero al hacer el Tukey, me dice:
>
> > TukeyHSD(ANOVAGalMan3,Sample*`Purification-step`,ordered = TRUE)Error
> in `[.data.frame`(mf, mf.cols[[i]]) : undefined columns selected
>
>
> aclaro que ANOVAGalMan3 es el resultado de anova.
>
> la tabla origen tiene la estructura:
>
> Sample Purification-step Total-sugar-content Total-protein-content
> G-M-ratio
> Prosopis affinis Yo 63,5 4,2 1,4
>
> y tiene algunos datos faltantes que aparecen como NA
>
> alguno puede ayudarme?
> muchas gracias saludos
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-07 Por tema Ruben Tobalina Ramirez
Perdón por el email anterior, se me ha escapado el enter.

Como decía, no buscaba ordenadores con linux instalado, que en realidad me
da igual porque lo instalo yo a mi gusto, sino que tuviesen hardware
adecuado. Por ejemplo, he comprobado que las tarjetas nvidia que aunque lo
nieguen no suelen ir del todo bien y además no la necesito. Y sobretodo, mi
pregunta iba por recomendación de marcas, que mi economia es escasa y
cuando me compro un pc pretendo alargar su uso lo máximo posible.

Bueno, gracias y perdón por la intromisión en el foro de una pregunta no
acorde!

rubén

El 7 de septiembre de 2016, 10:33, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenos días,
>
> la pregunta estaba un poco mal formulada. No buscaba tanto ordenadores con
> Linux instalado,
>
> El 6 de septiembre de 2016, 22:50, Carlos Ortega  > escribió:
>
>> Hola,
>>
>> Dell es los pocos que yo sepa que ofrecen equipos con Linux instalado
>> como SO de base:
>>
>> http://www.dell.com/es/empresas/p/xps-13-9350-laptop-ubuntu/pd?oc=bnx9333
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 6 de septiembre de 2016, 21:33, Ruben Tobalina Ramirez <
>> lagrimaescr...@gmail.com> escribió:
>>
>>> Buenas,
>>>
>>> gracias a los que me ayudaron, he conseguido hacer el código más o menos
>>> como queria. Lo pego por aqui por si a alguien le interesa. Me hubiese
>>> gustado hacerlo en dos ejes pero tengo que entregar la practica de la
>>> especialidad en 3 dias y hay muchas cosas que revisar, pero ya que he
>>> visto
>>> como se hace lo investigaré.
>>>
>>> ft$hora <- strptime(ft$hora, format = "%H:%M", tz="GMT-2")
>>> ft$Miles <- as.numeric(gsub("\\.", "", as.character(ft$Miles)))
>>> ft$Share <- as.numeric(gsub("\\,", ".", as.character(ft$Share)))
>>>
>>> ggbar <- ggplot(ft, aes(x = hora, y = frec)) +
>>>   geom_area(fill= "gray") +
>>>   scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
>>>   theme(panel.background = element_rect(fill = "white")) +
>>>   scale_y_continuous(limits=c(0,1500)) +
>>>   labs(x = "Minutos", y = "Tweets") + # Etiquetas o títulos de los ejes
>>>   theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x
>>>
>>> ggshr <- ggplot(ft, aes(x = hora, y = Share)) + geom_line(color="blue") +
>>>   scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
>>>   theme(panel.background = element_rect(fill = "white")) +
>>>   scale_y_continuous(limits=c(0,50)) +
>>>   labs(x = "Minutos", y = "Share (%)") + # Etiquetas o títulos de los
>>> ejes
>>>   theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x
>>>
>>> library(gridExtra)
>>> grid.arrange(ggbar, ggshr, nrow=2, ncol=1)
>>>
>>> Buenas noches!
>>>
>>> PD: Se me jodido, o esta punto de hacerlo mi portátil. Alguna sugerencia
>>> de
>>> marca "normal" que funcione de base muy bien con Linux??
>>>
>>> Rubén.
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
>
> --
> Rubén.
>



-- 
Rubén.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-06 Por tema Carlos Ortega
Hola,

Dell es los pocos que yo sepa que ofrecen equipos con Linux instalado como
SO de base:

http://www.dell.com/es/empresas/p/xps-13-9350-laptop-ubuntu/pd?oc=bnx9333

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 6 de septiembre de 2016, 21:33, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenas,
>
> gracias a los que me ayudaron, he conseguido hacer el código más o menos
> como queria. Lo pego por aqui por si a alguien le interesa. Me hubiese
> gustado hacerlo en dos ejes pero tengo que entregar la practica de la
> especialidad en 3 dias y hay muchas cosas que revisar, pero ya que he visto
> como se hace lo investigaré.
>
> ft$hora <- strptime(ft$hora, format = "%H:%M", tz="GMT-2")
> ft$Miles <- as.numeric(gsub("\\.", "", as.character(ft$Miles)))
> ft$Share <- as.numeric(gsub("\\,", ".", as.character(ft$Share)))
>
> ggbar <- ggplot(ft, aes(x = hora, y = frec)) +
>   geom_area(fill= "gray") +
>   scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500)) +
>   labs(x = "Minutos", y = "Tweets") + # Etiquetas o títulos de los ejes
>   theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x
>
> ggshr <- ggplot(ft, aes(x = hora, y = Share)) + geom_line(color="blue") +
>   scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,50)) +
>   labs(x = "Minutos", y = "Share (%)") + # Etiquetas o títulos de los ejes
>   theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x
>
> library(gridExtra)
> grid.arrange(ggbar, ggshr, nrow=2, ncol=1)
>
> Buenas noches!
>
> PD: Se me jodido, o esta punto de hacerlo mi portátil. Alguna sugerencia de
> marca "normal" que funcione de base muy bien con Linux??
>
> Rubén.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-06 Por tema Ruben Tobalina Ramirez
Buenas,

gracias a los que me ayudaron, he conseguido hacer el código más o menos
como queria. Lo pego por aqui por si a alguien le interesa. Me hubiese
gustado hacerlo en dos ejes pero tengo que entregar la practica de la
especialidad en 3 dias y hay muchas cosas que revisar, pero ya que he visto
como se hace lo investigaré.

ft$hora <- strptime(ft$hora, format = "%H:%M", tz="GMT-2")
ft$Miles <- as.numeric(gsub("\\.", "", as.character(ft$Miles)))
ft$Share <- as.numeric(gsub("\\,", ".", as.character(ft$Share)))

ggbar <- ggplot(ft, aes(x = hora, y = frec)) +
  geom_area(fill= "gray") +
  scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
  theme(panel.background = element_rect(fill = "white")) +
  scale_y_continuous(limits=c(0,1500)) +
  labs(x = "Minutos", y = "Tweets") + # Etiquetas o títulos de los ejes
  theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x

ggshr <- ggplot(ft, aes(x = hora, y = Share)) + geom_line(color="blue") +
  scale_x_datetime(date_breaks = "5 mins", date_labels = "%H:%M") +
  theme(panel.background = element_rect(fill = "white")) +
  scale_y_continuous(limits=c(0,50)) +
  labs(x = "Minutos", y = "Share (%)") + # Etiquetas o títulos de los ejes
  theme(axis.text.x=element_text(angle=90)) # Orientación texto eje x

library(gridExtra)
grid.arrange(ggbar, ggshr, nrow=2, ncol=1)

Buenas noches!

PD: Se me jodido, o esta punto de hacerlo mi portátil. Alguna sugerencia de
marca "normal" que funcione de base muy bien con Linux??

Rubén.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Carlos J. Gil Bellosta
Sí, la primera reunión de la temporada será el 8 de este mes.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 3 de septiembre de 2016, 23:52, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Muchas gracias a todos!
>
> Pues si, Eric, R a veces me vuelve loco, tiene una lógica muy particular.
> Miraré el libro, que lattice no lo he usado nunca.
>
> Gracias Carlos, con tu ejemplo creo que he conseguido hacer el grafico que
> queria.
>
> Muchas gracias! Os debo una caña un dia de estos - a los madrileños- en
> las reuniones de Medialab. Este año os seguireis reuniendo en Medialab?
>
> Un abrazo!
> Prueba algo así:
>
> library(ggplot2)
>
> datos <- read.table("Downloads/pec.csv", header = T, sep = ";", dec = ",")
> datos$Miles <- as.numeric(gsub("\\.", "", as.character(datos$Miles)))
>
> datos$hora <- strptime(datos$hora, format = "%H:%M")
>
> ggplot(datos, aes(x = hora, y = Miles)) + geom_line() +
>   scale_x_datetime(date_breaks = "15 mins", date_labels = "%H:%M")
>
>
> Además, en aes no hay que hacer referencia a la tabla. Expresiones como
>
> ggplot(datos, aes(x = datos$hora, y = datos$Miles)) + ...
>
> son innecesariamente redundantes.
>
> Salud,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El 3 de septiembre de 2016, 18:14, Ruben Tobalina Ramirez <
> lagrimaescr...@gmail.com> escribió:
>
>> Buenas tardes!
>>
>> uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
>> responder antes, aunque esta madrugada antes de ir a currar los he probado.
>> Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
>> y va perfecto. Luego pruebo con mis datos - haciendo los cambios
>> correspondientes - y R me fusila a errores:D
>>
>> De hecho el segundo gráfico - el del share - no sale con los
>> consiguientes errores -dependiendo la la variable que use (Share o miles):
>>
>>
>>
>> *Error: Discrete value supplied to continuous scalegeom_path: Each group
>> consists of only one observation. Do you need to adjust the groupaesthetic?*
>>
>> Modifique el código tal que así:
>>
>> ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
>>   geom_bar(stat="identity", width = 0.8, fill="gray") +
>>   theme(panel.background = element_rect(fill = "white")) +
>>   scale_y_continuous(limits=c(0,1500))
>> ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
>>   geom_line()+
>>   theme(panel.background = element_rect(fill = "white")) +
>>   scale_y_continuous(limits=c(0,1500))
>>
>> library(gridExtra)
>> grid.arrange(ggbar, ggline, nrow=2, ncol=1)
>>
>> No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
>> que esta hecho a propósito, y por eso supongo que me da el primer error,
>> pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
>> [image: Imágenes integradas 2]
>>
>> Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas
>> en el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo
>> así?
>>
>> Un saludo!
>>
>>
>> El 3 de septiembre de 2016, 0:12, Carlos Ortega > > escribió:
>>
>>> Y bueno, algo más bonito sí que queda con ggplot...
>>>
>>> #---
>>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>>
>>> library(ggplot2)
>>> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
>>> lab_x <- as.vector(datIn$hora[ lab_x_idx])
>>> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>>>  geom_bar(stat = "identity") +
>>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>>> datIn$hora[nrow(datIn)], sep = "") ) +
>>>  ylab("Frecuencia") +
>>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>>>  theme_minimal()
>>> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>>>  geom_line() +
>>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>>> datIn$hora[nrow(datIn)], sep = "") ) +
>>>  ylab("Share") +
>>>  ylim(0, max(datIn$Share)*1.10) +
>>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x
>>> ) +
>>>  theme_minimal()
>>> library(gridExtra)
>>> grid.arrange(fre_gg, sha_gg, nrow=2, ncol=1)
>>>
>>> #---
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>>
>>> El 2 de septiembre de 2016, 21:47, Carlos Ortega <
>>> c...@qualityexcellence.es> escribió:
>>>
 Hola,

 Aproximación muy sencillita...con gráficos "base":

 #-

 datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")

 par(mfrow = c(2,1))
 barplot(
   datIn$frec
  ,las = 1
  ,col = "green"
  ,cex.axis = 0.7, col.axis = "red", font.axis = 2
  ,main = "Frequency"
 )
 box()
 plot(
   datIn$Share
  ,type = "b"
  ,col = "blue", bg = "blue", col.axis = "red", font.axis = 2
   

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Ruben Tobalina Ramirez
Muchas gracias a todos!

Pues si, Eric, R a veces me vuelve loco, tiene una lógica muy particular.
Miraré el libro, que lattice no lo he usado nunca.

Gracias Carlos, con tu ejemplo creo que he conseguido hacer el grafico que
queria.

Muchas gracias! Os debo una caña un dia de estos - a los madrileños- en las
reuniones de Medialab. Este año os seguireis reuniendo en Medialab?

Un abrazo!
Prueba algo así:

library(ggplot2)

datos <- read.table("Downloads/pec.csv", header = T, sep = ";", dec = ",")
datos$Miles <- as.numeric(gsub("\\.", "", as.character(datos$Miles)))

datos$hora <- strptime(datos$hora, format = "%H:%M")

ggplot(datos, aes(x = hora, y = Miles)) + geom_line() +
  scale_x_datetime(date_breaks = "15 mins", date_labels = "%H:%M")


Además, en aes no hay que hacer referencia a la tabla. Expresiones como

ggplot(datos, aes(x = datos$hora, y = datos$Miles)) + ...

son innecesariamente redundantes.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 3 de septiembre de 2016, 18:14, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenas tardes!
>
> uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
> responder antes, aunque esta madrugada antes de ir a currar los he probado.
> Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
> y va perfecto. Luego pruebo con mis datos - haciendo los cambios
> correspondientes - y R me fusila a errores:D
>
> De hecho el segundo gráfico - el del share - no sale con los consiguientes
> errores -dependiendo la la variable que use (Share o miles):
>
>
>
> *Error: Discrete value supplied to continuous scalegeom_path: Each group
> consists of only one observation. Do you need to adjust the groupaesthetic?*
>
> Modifique el código tal que así:
>
> ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
>   geom_bar(stat="identity", width = 0.8, fill="gray") +
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
> ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
>   geom_line()+
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
>
> library(gridExtra)
> grid.arrange(ggbar, ggline, nrow=2, ncol=1)
>
> No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
> que esta hecho a propósito, y por eso supongo que me da el primer error,
> pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
> [image: Imágenes integradas 2]
>
> Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas
> en el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo
> así?
>
> Un saludo!
>
>
> El 3 de septiembre de 2016, 0:12, Carlos Ortega 
> escribió:
>
>> Y bueno, algo más bonito sí que queda con ggplot...
>>
>> #---
>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>
>> library(ggplot2)
>> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
>> lab_x <- as.vector(datIn$hora[ lab_x_idx])
>> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>>  geom_bar(stat = "identity") +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Frecuencia") +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>>  theme_minimal()
>> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>>  geom_line() +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Share") +
>>  ylim(0, max(datIn$Share)*1.10) +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x )
>> +
>>  theme_minimal()
>> library(gridExtra)
>> grid.arrange(fre_gg, sha_gg, nrow=2, ncol=1)
>>
>> #---
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> El 2 de septiembre de 2016, 21:47, Carlos Ortega <
>> c...@qualityexcellence.es> escribió:
>>
>>> Hola,
>>>
>>> Aproximación muy sencillita...con gráficos "base":
>>>
>>> #-
>>>
>>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>>
>>> par(mfrow = c(2,1))
>>> barplot(
>>>   datIn$frec
>>>  ,las = 1
>>>  ,col = "green"
>>>  ,cex.axis = 0.7, col.axis = "red", font.axis = 2
>>>  ,main = "Frequency"
>>> )
>>> box()
>>> plot(
>>>   datIn$Share
>>>  ,type = "b"
>>>  ,col = "blue", bg = "blue", col.axis = "red", font.axis = 2
>>>  ,cex = 0.7
>>>  ,cex.axis = 0.7
>>>  ,las = 1
>>>  ,main = "Share", ylab = "", xlab = ""
>>>  ,ylim = c(0, 1.10*max(datIn$Share))
>>> )
>>>
>>> #-
>>>
>>> Yo haría la representación por separado, mejor que un gráfico con doble
>>> eje.
>>> Pero si quieres hacer un gráfico de doble eje:
>>> http://ellisp.github.io/blog/2016/08/28/dualaxes2
>>>
>>> Y 

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Carlos J. Gil Bellosta
Prueba algo así:

library(ggplot2)

datos <- read.table("Downloads/pec.csv", header = T, sep = ";", dec = ",")
datos$Miles <- as.numeric(gsub("\\.", "", as.character(datos$Miles)))

datos$hora <- strptime(datos$hora, format = "%H:%M")

ggplot(datos, aes(x = hora, y = Miles)) + geom_line() +
  scale_x_datetime(date_breaks = "15 mins", date_labels = "%H:%M")


Además, en aes no hay que hacer referencia a la tabla. Expresiones como

ggplot(datos, aes(x = datos$hora, y = datos$Miles)) + ...

son innecesariamente redundantes.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 3 de septiembre de 2016, 18:14, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenas tardes!
>
> uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
> responder antes, aunque esta madrugada antes de ir a currar los he probado.
> Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
> y va perfecto. Luego pruebo con mis datos - haciendo los cambios
> correspondientes - y R me fusila a errores:D
>
> De hecho el segundo gráfico - el del share - no sale con los consiguientes
> errores -dependiendo la la variable que use (Share o miles):
>
>
>
> *Error: Discrete value supplied to continuous scalegeom_path: Each group
> consists of only one observation. Do you need to adjust the groupaesthetic?*
>
> Modifique el código tal que así:
>
> ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
>   geom_bar(stat="identity", width = 0.8, fill="gray") +
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
> ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
>   geom_line()+
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
>
> library(gridExtra)
> grid.arrange(ggbar, ggline, nrow=2, ncol=1)
>
> No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
> que esta hecho a propósito, y por eso supongo que me da el primer error,
> pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
> [image: Imágenes integradas 2]
>
> Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas
> en el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo
> así?
>
> Un saludo!
>
>
> El 3 de septiembre de 2016, 0:12, Carlos Ortega 
> escribió:
>
>> Y bueno, algo más bonito sí que queda con ggplot...
>>
>> #---
>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>
>> library(ggplot2)
>> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
>> lab_x <- as.vector(datIn$hora[ lab_x_idx])
>> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>>  geom_bar(stat = "identity") +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Frecuencia") +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>>  theme_minimal()
>> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>>  geom_line() +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Share") +
>>  ylim(0, max(datIn$Share)*1.10) +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x )
>> +
>>  theme_minimal()
>> library(gridExtra)
>> grid.arrange(fre_gg, sha_gg, nrow=2, ncol=1)
>>
>> #---
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> El 2 de septiembre de 2016, 21:47, Carlos Ortega <
>> c...@qualityexcellence.es> escribió:
>>
>>> Hola,
>>>
>>> Aproximación muy sencillita...con gráficos "base":
>>>
>>> #-
>>>
>>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>>
>>> par(mfrow = c(2,1))
>>> barplot(
>>>   datIn$frec
>>>  ,las = 1
>>>  ,col = "green"
>>>  ,cex.axis = 0.7, col.axis = "red", font.axis = 2
>>>  ,main = "Frequency"
>>> )
>>> box()
>>> plot(
>>>   datIn$Share
>>>  ,type = "b"
>>>  ,col = "blue", bg = "blue", col.axis = "red", font.axis = 2
>>>  ,cex = 0.7
>>>  ,cex.axis = 0.7
>>>  ,las = 1
>>>  ,main = "Share", ylab = "", xlab = ""
>>>  ,ylim = c(0, 1.10*max(datIn$Share))
>>> )
>>>
>>> #-
>>>
>>> Yo haría la representación por separado, mejor que un gráfico con doble
>>> eje.
>>> Pero si quieres hacer un gráfico de doble eje:
>>> http://ellisp.github.io/blog/2016/08/28/dualaxes2
>>>
>>> Y como referencia para hacer gráficos (en español):
>>> https://www.amazon.es/Gráficos-Estadísticos-Castor-Guisande-
>>> González/dp/8499692117/ref=sr_1_1?ie=UTF8=1472845192=
>>> 8-1=graficos+en+R
>>> 
>>>
>>> Nota: Si quieres incluir las horas 

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Ruben Tobalina Ramirez
Buenas tardes!

uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
responder antes, aunque esta madrugada antes de ir a currar los he probado.
Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
y va perfecto. Luego pruebo con mis datos - haciendo los cambios
correspondientes - y R me fusila a errores:D

De hecho el segundo gráfico - el del share - no sale con los consiguientes
errores -dependiendo la la variable que use (Share o miles):



*Error: Discrete value supplied to continuous scalegeom_path: Each group
consists of only one observation. Do you need to adjust the groupaesthetic?*

Modifique el código tal que así:

ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
  geom_bar(stat="identity", width = 0.8, fill="gray") +
  theme(panel.background = element_rect(fill = "white")) +
  scale_y_continuous(limits=c(0,1500))
ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
  geom_line()+
  theme(panel.background = element_rect(fill = "white")) +
  scale_y_continuous(limits=c(0,1500))

library(gridExtra)
grid.arrange(ggbar, ggline, nrow=2, ncol=1)

No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
que esta hecho a propósito, y por eso supongo que me da el primer error,
pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
[image: Imágenes integradas 2]

Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas en
el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo así?

Un saludo!


El 3 de septiembre de 2016, 0:12, Carlos Ortega 
escribió:

> Y bueno, algo más bonito sí que queda con ggplot...
>
> #---
> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>
> library(ggplot2)
> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
> lab_x <- as.vector(datIn$hora[ lab_x_idx])
> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>  geom_bar(stat = "identity") +
>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
> datIn$hora[nrow(datIn)], sep = "") ) +
>  ylab("Frecuencia") +
>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>  theme_minimal()
> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>  geom_line() +
>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
> datIn$hora[nrow(datIn)], sep = "") ) +
>  ylab("Share") +
>  ylim(0, max(datIn$Share)*1.10) +
>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x )
> +
>  theme_minimal()
> library(gridExtra)
> grid.arrange(fre_gg, sha_gg, nrow=2, ncol=1)
>
> #---
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
> El 2 de septiembre de 2016, 21:47, Carlos Ortega  > escribió:
>
>> Hola,
>>
>> Aproximación muy sencillita...con gráficos "base":
>>
>> #-
>>
>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>
>> par(mfrow = c(2,1))
>> barplot(
>>   datIn$frec
>>  ,las = 1
>>  ,col = "green"
>>  ,cex.axis = 0.7, col.axis = "red", font.axis = 2
>>  ,main = "Frequency"
>> )
>> box()
>> plot(
>>   datIn$Share
>>  ,type = "b"
>>  ,col = "blue", bg = "blue", col.axis = "red", font.axis = 2
>>  ,cex = 0.7
>>  ,cex.axis = 0.7
>>  ,las = 1
>>  ,main = "Share", ylab = "", xlab = ""
>>  ,ylim = c(0, 1.10*max(datIn$Share))
>> )
>>
>> #-
>>
>> Yo haría la representación por separado, mejor que un gráfico con doble
>> eje.
>> Pero si quieres hacer un gráfico de doble eje:
>> http://ellisp.github.io/blog/2016/08/28/dualaxes2
>>
>> Y como referencia para hacer gráficos (en español):
>> https://www.amazon.es/Gráficos-Estadísticos-Castor-Guisande-
>> González/dp/8499692117/ref=sr_1_1?ie=UTF8=1472845192=
>> 8-1=graficos+en+R
>> 
>>
>> Nota: Si quieres incluir las horas minutos en el eje "X" de cualquiera de
>> los dos gráficos:
>> http://stackoverflow.com/questions/5182238/r-replace-x-axis-
>> with-own-values
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> El 2 de septiembre de 2016, 20:25, Ruben Tobalina Ramirez <
>> lagrimaescr...@gmail.com> escribió:
>>
>>> Buenas tardes,
>>>
>>> Tengo una duda con gráficos. Estoy intentando realizar el típico gráfico
>>> de una variable en histograma y otra en linea, supongo que será sencillo
>>> pero llevo unos días peleando y no me sale de forma correcta.
>>>
>>> Las variables están en un dataframe que muestran las frecuencias de
>>> tweets minuto a minuto y el share de esos minutos (os adjunto un archivo en
>>> csv con el dataframe).
>>>
>>> Una muestra del data frame:
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>> *   hora frec Miles Share  1 

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-02 Por tema Carlos Ortega
Hola,

Aproximación muy sencillita...con gráficos "base":

#-

datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")

par(mfrow = c(2,1))
barplot(
  datIn$frec
 ,las = 1
 ,col = "green"
 ,cex.axis = 0.7, col.axis = "red", font.axis = 2
 ,main = "Frequency"
)
box()
plot(
  datIn$Share
 ,type = "b"
 ,col = "blue", bg = "blue", col.axis = "red", font.axis = 2
 ,cex = 0.7
 ,cex.axis = 0.7
 ,las = 1
 ,main = "Share", ylab = "", xlab = ""
 ,ylim = c(0, 1.10*max(datIn$Share))
)

#-

Yo haría la representación por separado, mejor que un gráfico con doble eje.
Pero si quieres hacer un gráfico de doble eje:
http://ellisp.github.io/blog/2016/08/28/dualaxes2

Y como referencia para hacer gráficos (en español):
https://www.amazon.es/Gráficos-Estadísticos-Castor-Guisande-González/dp/8499692117/ref=sr_1_1?ie=UTF8=1472845192=8-1=graficos+en+R


Nota: Si quieres incluir las horas minutos en el eje "X" de cualquiera de
los dos gráficos:
http://stackoverflow.com/questions/5182238/r-replace-x-axis-with-own-values

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 2 de septiembre de 2016, 20:25, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenas tardes,
>
> Tengo una duda con gráficos. Estoy intentando realizar el típico gráfico
> de una variable en histograma y otra en linea, supongo que será sencillo
> pero llevo unos días peleando y no me sale de forma correcta.
>
> Las variables están en un dataframe que muestran las frecuencias de tweets
> minuto a minuto y el share de esos minutos (os adjunto un archivo en csv
> con el dataframe).
>
> Una muestra del data frame:
>
>
>
>
>
>
>
>
> *   hora frec Miles Share  1 20:22   87 1.016
> 13,0
> 2 20:23  123 1.031  13,33 20:24  153 1.048  13,5  4 20:25  192 1.165  15,0
> 5 20:26  175 1.239  15,8 6 20:27  225 1.331  17,0*
>
> He probado con *plot* y el parámetro *new* sin éxito, y ahora estaba
> probando con *ggplot*:
>
>
>
> *ggplot(ft, aes(ft[,2:3])) +   geom_bar(aes(ft[,2]), colour="black", fill
> = "orange") +   geom_line(aes(x=ft$hora,y=ft[,3]), colour="black") *
>
> Se me muestran las variables pero de forma incorrecta. ¿Alguna sugerencia?
> De paso, me podéis indicar algún manual para aprender a realizar gráficos
> con R?
>
> Muchas gracias!
>
> Un saludo!!!
>
>
> --
> Rubén.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda frecuencia asistencia clase

2016-07-05 Por tema Javier Marcuzzi
Estimado Sebastián Kruk

La respuesta es sí, pero su mensaje sale difícil de interpretar en mi 
computadora.

No comprendo correctamente su pregunta, creo que todos los libros deben tener 
un ejemplo de R y frecuencias, su problema no entra en mi cabeza.

Javier Rubén Marcuzzi

De: Sebastian Kruk
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda sencilla (SQL)

2016-06-24 Por tema Mauricio Monsalvo
Muchas gracias, Carlos.

El 22 de junio de 2016, 21:14, Carlos Ortega 
escribió:

> Hola,
>
> Hay una forma más sencilla  utilizando "table()"...
>
> > datIn <- read.table("Datos.csv", sep = ";", header = TRUE)
> > datIn <- na.omit(datIn)
> > Cont_df <- as.data.frame(table(datIn$Laboratorio, datIn$Camara))
> > Cont_end <- Cont_df[ Cont_df$Freq > 0, ]
> > Cont_end <- Cont_end[ order(Cont_end$Freq, decreasing = TRUE), ]
> > names(Cont_end) <- c("Lab", "Camara", "Freq")
> > row.names(Cont_end) <- NULL
> > head(Cont_end)
>LabCamara Freq
> 1  LKM COOPERALA   45
> 2   FRESENIUS KABI COOPERALA   40
> 3 MICROSULES ARGENTINA COOPERALA   30
> 4  BIOPROFARMA COOPERALA   27
> 5ASPEN COOPERALA   19
> 6  GOBBI NOVAG CAEMe   17
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
>
>
>
>
> El 23 de junio de 2016, 1:32, Mauricio Monsalvo 
> escribió:
>
>> Claro, porque es "sqldf" y no "sqldb" :) Gracias de nuevo. Prometo volver
>> a mirar el código antes de molestar en el grupo la próxima vez.
>>
>> El 22 de junio de 2016, 20:27, Carlos Ortega 
>> escribió:
>>
>>> Estoy en 3.3.0 y "sqldf" lo instala sin problemas...
>>>
>>> El 23 de junio de 2016, 1:23, Mauricio Monsalvo 
>>> escribió:
>>>
 Malas nuevas para mi:
   package ‘sqldb’ is not available (for R version 3.3.0)
 ¿Puedo hacer algo más que esperar? No me voy a "bajar" de versión de R.

 El 22 de junio de 2016, 20:02, Mauricio Monsalvo 
 escribió:

> Muchas gracias, Carlos.
> Sobre todo por el sqldf, que seguro me ahorre mucho tiempo. La opción
> que se plante de primero d <- table(tips$day) y luego dim(d) me
> parece menos eficiente y cómo que directamente sqldf("select
> count(distinct day) from tips"), pero supongo que esos son gustos!
> También son "cómodas" las líneas: aggregate(subjectid ~ cond, data =
> dat, FUN = function(x) length(unique(x))) o bien tapply(a$subjectid,
> a$cond, function(x) length(unique(x))), pero tienen algo de R que
> intuitivamente nunca me sale... supongo que por no comprender cuándo
> corresponde el uso de function(x).
> ​Adjunto una selección de mis datos en .csv para probar con
> data.table (si lo recomendas para novatos, sigo probando con él).-
>
>
> El 22 de junio de 2016, 19:36, Carlos Ortega  > escribió:
>
>> Hola,
>>
>> Estas pueden ser posibles soluciones:
>>
>>
>> http://stackoverflow.com/questions/5459454/counting-unique-items-in-data-frame
>>
>>
>> http://stackoverflow.com/questions/10112177/how-to-count-distinct-entries-within-a-column-of-a-data-frame
>>
>> Y si envías un mínimo conjunto de datos para terminar de entender el
>> conjunto... seguro que encontramos la solución con data.table...
>>
>> Saludos,
>> Carlos.
>>
>> El 23 de junio de 2016, 0:31, Mauricio Monsalvo > > escribió:
>>
>>> Hola
>>> Necesito algo simple pero no logro resolverlo en R: contar elementos
>>> distintos (unique) pero agrupados. En SQL sería: SELECT Camara,
>>> count(DISTINCT(Laboratorio)) as Lab FROM [datos] GROUP BY Camara.
>>> Puedo hacerlo para toda la matriz de datos
>>> con length(unique(datos$Laboratorio)) pero no logro hacerlo agrupado
>>> por
>>> una variable (factor) dada.
>>> Estuve intentando con el paquete data.table pero me parece un tanto
>>> complejo (para mi nivel al menos) y si bien hay funciones
>>> equivalentes, al
>>> menos en lo que alcancé a ver no logró usar el DINTINCT.-
>>> Muchas gracias.
>>> --
>>> Mauricio
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
>
> --
> Mauricio
>



 --
 Mauricio

>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>>
>> --
>> Mauricio
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Mauricio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda sencilla (SQL)

2016-06-22 Por tema Carlos Ortega
Hola,

Hay una forma más sencilla  utilizando "table()"...

> datIn <- read.table("Datos.csv", sep = ";", header = TRUE)
> datIn <- na.omit(datIn)
> Cont_df <- as.data.frame(table(datIn$Laboratorio, datIn$Camara))
> Cont_end <- Cont_df[ Cont_df$Freq > 0, ]
> Cont_end <- Cont_end[ order(Cont_end$Freq, decreasing = TRUE), ]
> names(Cont_end) <- c("Lab", "Camara", "Freq")
> row.names(Cont_end) <- NULL
> head(Cont_end)
   LabCamara Freq
1  LKM COOPERALA   45
2   FRESENIUS KABI COOPERALA   40
3 MICROSULES ARGENTINA COOPERALA   30
4  BIOPROFARMA COOPERALA   27
5ASPEN COOPERALA   19
6  GOBBI NOVAG CAEMe   17

Saludos,
Carlos Ortega
www.qualityexcellence.es







El 23 de junio de 2016, 1:32, Mauricio Monsalvo 
escribió:

> Claro, porque es "sqldf" y no "sqldb" :) Gracias de nuevo. Prometo volver
> a mirar el código antes de molestar en el grupo la próxima vez.
>
> El 22 de junio de 2016, 20:27, Carlos Ortega 
> escribió:
>
>> Estoy en 3.3.0 y "sqldf" lo instala sin problemas...
>>
>> El 23 de junio de 2016, 1:23, Mauricio Monsalvo 
>> escribió:
>>
>>> Malas nuevas para mi:
>>>   package ‘sqldb’ is not available (for R version 3.3.0)
>>> ¿Puedo hacer algo más que esperar? No me voy a "bajar" de versión de R.
>>>
>>> El 22 de junio de 2016, 20:02, Mauricio Monsalvo 
>>> escribió:
>>>
 Muchas gracias, Carlos.
 Sobre todo por el sqldf, que seguro me ahorre mucho tiempo. La opción
 que se plante de primero d <- table(tips$day) y luego dim(d) me parece
 menos eficiente y cómo que directamente sqldf("select count(distinct
 day) from tips"), pero supongo que esos son gustos!
 También son "cómodas" las líneas: aggregate(subjectid ~ cond, data =
 dat, FUN = function(x) length(unique(x))) o bien tapply(a$subjectid,
 a$cond, function(x) length(unique(x))), pero tienen algo de R que
 intuitivamente nunca me sale... supongo que por no comprender cuándo
 corresponde el uso de function(x).
 ​Adjunto una selección de mis datos en .csv para probar con data.table
 (si lo recomendas para novatos, sigo probando con él).-


 El 22 de junio de 2016, 19:36, Carlos Ortega 
 escribió:

> Hola,
>
> Estas pueden ser posibles soluciones:
>
>
> http://stackoverflow.com/questions/5459454/counting-unique-items-in-data-frame
>
>
> http://stackoverflow.com/questions/10112177/how-to-count-distinct-entries-within-a-column-of-a-data-frame
>
> Y si envías un mínimo conjunto de datos para terminar de entender el
> conjunto... seguro que encontramos la solución con data.table...
>
> Saludos,
> Carlos.
>
> El 23 de junio de 2016, 0:31, Mauricio Monsalvo 
> escribió:
>
>> Hola
>> Necesito algo simple pero no logro resolverlo en R: contar elementos
>> distintos (unique) pero agrupados. En SQL sería: SELECT Camara,
>> count(DISTINCT(Laboratorio)) as Lab FROM [datos] GROUP BY Camara.
>> Puedo hacerlo para toda la matriz de datos
>> con length(unique(datos$Laboratorio)) pero no logro hacerlo agrupado
>> por
>> una variable (factor) dada.
>> Estuve intentando con el paquete data.table pero me parece un tanto
>> complejo (para mi nivel al menos) y si bien hay funciones
>> equivalentes, al
>> menos en lo que alcancé a ver no logró usar el DINTINCT.-
>> Muchas gracias.
>> --
>> Mauricio
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



 --
 Mauricio

>>>
>>>
>>>
>>> --
>>> Mauricio
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
>
> --
> Mauricio
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda sencilla (SQL)

2016-06-22 Por tema Mauricio Monsalvo
Claro, porque es "sqldf" y no "sqldb" :) Gracias de nuevo. Prometo volver a
mirar el código antes de molestar en el grupo la próxima vez.

El 22 de junio de 2016, 20:27, Carlos Ortega 
escribió:

> Estoy en 3.3.0 y "sqldf" lo instala sin problemas...
>
> El 23 de junio de 2016, 1:23, Mauricio Monsalvo 
> escribió:
>
>> Malas nuevas para mi:
>>   package ‘sqldb’ is not available (for R version 3.3.0)
>> ¿Puedo hacer algo más que esperar? No me voy a "bajar" de versión de R.
>>
>> El 22 de junio de 2016, 20:02, Mauricio Monsalvo 
>> escribió:
>>
>>> Muchas gracias, Carlos.
>>> Sobre todo por el sqldf, que seguro me ahorre mucho tiempo. La opción
>>> que se plante de primero d <- table(tips$day) y luego dim(d) me parece
>>> menos eficiente y cómo que directamente sqldf("select count(distinct
>>> day) from tips"), pero supongo que esos son gustos!
>>> También son "cómodas" las líneas: aggregate(subjectid ~ cond, data =
>>> dat, FUN = function(x) length(unique(x))) o bien tapply(a$subjectid,
>>> a$cond, function(x) length(unique(x))), pero tienen algo de R que
>>> intuitivamente nunca me sale... supongo que por no comprender cuándo
>>> corresponde el uso de function(x).
>>> ​Adjunto una selección de mis datos en .csv para probar con data.table
>>> (si lo recomendas para novatos, sigo probando con él).-
>>>
>>>
>>> El 22 de junio de 2016, 19:36, Carlos Ortega 
>>> escribió:
>>>
 Hola,

 Estas pueden ser posibles soluciones:


 http://stackoverflow.com/questions/5459454/counting-unique-items-in-data-frame


 http://stackoverflow.com/questions/10112177/how-to-count-distinct-entries-within-a-column-of-a-data-frame

 Y si envías un mínimo conjunto de datos para terminar de entender el
 conjunto... seguro que encontramos la solución con data.table...

 Saludos,
 Carlos.

 El 23 de junio de 2016, 0:31, Mauricio Monsalvo 
 escribió:

> Hola
> Necesito algo simple pero no logro resolverlo en R: contar elementos
> distintos (unique) pero agrupados. En SQL sería: SELECT Camara,
> count(DISTINCT(Laboratorio)) as Lab FROM [datos] GROUP BY Camara.
> Puedo hacerlo para toda la matriz de datos
> con length(unique(datos$Laboratorio)) pero no logro hacerlo agrupado
> por
> una variable (factor) dada.
> Estuve intentando con el paquete data.table pero me parece un tanto
> complejo (para mi nivel al menos) y si bien hay funciones
> equivalentes, al
> menos en lo que alcancé a ver no logró usar el DINTINCT.-
> Muchas gracias.
> --
> Mauricio
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



 --
 Saludos,
 Carlos Ortega
 www.qualityexcellence.es

>>>
>>>
>>>
>>> --
>>> Mauricio
>>>
>>
>>
>>
>> --
>> Mauricio
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Mauricio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda sencilla (SQL)

2016-06-22 Por tema Mauricio Monsalvo
Malas nuevas para mi:
  package ‘sqldb’ is not available (for R version 3.3.0)
¿Puedo hacer algo más que esperar? No me voy a "bajar" de versión de R.

El 22 de junio de 2016, 20:02, Mauricio Monsalvo 
escribió:

> Muchas gracias, Carlos.
> Sobre todo por el sqldf, que seguro me ahorre mucho tiempo. La opción que
> se plante de primero d <- table(tips$day) y luego dim(d) me parece menos
> eficiente y cómo que directamente sqldf("select count(distinct day) from
> tips"), pero supongo que esos son gustos!
> También son "cómodas" las líneas: aggregate(subjectid ~ cond, data = dat,
> FUN = function(x) length(unique(x))) o bien tapply(a$subjectid, a$cond,
> function(x) length(unique(x))), pero tienen algo de R que intuitivamente
> nunca me sale... supongo que por no comprender cuándo corresponde el uso de
> function(x).
> ​Adjunto una selección de mis datos en .csv para probar con data.table
> (si lo recomendas para novatos, sigo probando con él).-
>
>
> El 22 de junio de 2016, 19:36, Carlos Ortega 
> escribió:
>
>> Hola,
>>
>> Estas pueden ser posibles soluciones:
>>
>>
>> http://stackoverflow.com/questions/5459454/counting-unique-items-in-data-frame
>>
>>
>> http://stackoverflow.com/questions/10112177/how-to-count-distinct-entries-within-a-column-of-a-data-frame
>>
>> Y si envías un mínimo conjunto de datos para terminar de entender el
>> conjunto... seguro que encontramos la solución con data.table...
>>
>> Saludos,
>> Carlos.
>>
>> El 23 de junio de 2016, 0:31, Mauricio Monsalvo 
>> escribió:
>>
>>> Hola
>>> Necesito algo simple pero no logro resolverlo en R: contar elementos
>>> distintos (unique) pero agrupados. En SQL sería: SELECT Camara,
>>> count(DISTINCT(Laboratorio)) as Lab FROM [datos] GROUP BY Camara.
>>> Puedo hacerlo para toda la matriz de datos
>>> con length(unique(datos$Laboratorio)) pero no logro hacerlo agrupado por
>>> una variable (factor) dada.
>>> Estuve intentando con el paquete data.table pero me parece un tanto
>>> complejo (para mi nivel al menos) y si bien hay funciones equivalentes,
>>> al
>>> menos en lo que alcancé a ver no logró usar el DINTINCT.-
>>> Muchas gracias.
>>> --
>>> Mauricio
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
>
> --
> Mauricio
>



-- 
Mauricio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda sencilla (SQL)

2016-06-22 Por tema Carlos Ortega
Hola,

Estas pueden ser posibles soluciones:

http://stackoverflow.com/questions/5459454/counting-unique-items-in-data-frame

http://stackoverflow.com/questions/10112177/how-to-count-distinct-entries-within-a-column-of-a-data-frame

Y si envías un mínimo conjunto de datos para terminar de entender el
conjunto... seguro que encontramos la solución con data.table...

Saludos,
Carlos.

El 23 de junio de 2016, 0:31, Mauricio Monsalvo 
escribió:

> Hola
> Necesito algo simple pero no logro resolverlo en R: contar elementos
> distintos (unique) pero agrupados. En SQL sería: SELECT Camara,
> count(DISTINCT(Laboratorio)) as Lab FROM [datos] GROUP BY Camara.
> Puedo hacerlo para toda la matriz de datos
> con length(unique(datos$Laboratorio)) pero no logro hacerlo agrupado por
> una variable (factor) dada.
> Estuve intentando con el paquete data.table pero me parece un tanto
> complejo (para mi nivel al menos) y si bien hay funciones equivalentes, al
> menos en lo que alcancé a ver no logró usar el DINTINCT.-
> Muchas gracias.
> --
> Mauricio
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con la homocedasticidad de Varianza

2016-06-14 Por tema José Trujillo Carmona

El 14/06/16 a las 15:58, mora...@us.es escribió:

Hola, puedes calcular las cuasivarianzas muestrales por columnas
mediante tapply y luego
compararlas. El cociente entre las dos varianzas sigue una distribución
F de Snedecor con grados de libertad n1-1 y n2-2. Puedes calcular la
probabilidad de aceptar H0
con la función pf.



Eso solo es cierto si las variables constituyen muestras procedentes de 
variables aleatorias normales.


El cociente de varianzas solo sigue una distribución F de Snedecor en el 
caso de  variables normales. Incluso su comportamiento asintótico solo 
está indicado para muestras muy muy grandes.


Para variables no normales dispones de contrastes como el de 
Ansari-Bradley (en R es la función ansari.test), o el test de Moses (que 
es el que usa SPSS y en R está también disponible en el paquete DescTools).


En R hay disponibles otros como el de Mood o el de Siegel-Tukey, pero el 
primero de los señalados en el párrafo anterior tiene una gran potencia 
asintótica y el segundo es el más utilizado (por el efecto de 
penetración de mercado del SPSS).


Pero insisto, para las variables del ejemplo, es obvio que no se 
necesita ningún test: No hay ninguna razón para pensar que estas 
variables puedan compartir varianza. Ni siquiera el principio de 
parsimonia puede ser invocado para variables con distintas unidades de 
medida y escala como tienen las variables mostradas.


Saludos.

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con la homocedasticidad de Varianza

2016-06-14 Por tema morales
Hola, puedes calcular las cuasivarianzas muestrales por columnas
mediante tapply y luego
compararlas. El cociente entre las dos varianzas sigue una distribución
F de Snedecor con grados de libertad n1-1 y n2-2. Puedes calcular la
probabilidad de aceptar H0 
con la función pf.

El 14/06/2016 12:00, r-help-es-requ...@r-project.org escribió:

> Envíe los mensajes para la lista R-help-es a
> r-help-es@r-project.org
> 
> Para subscribirse o anular su subscripción a través de la WEB
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 
> O por correo electrónico, enviando un mensaje con el texto "help" en
> el asunto (subject) o en el cuerpo a:
> r-help-es-requ...@r-project.org
> 
> Puede contactar con el responsable de la lista escribiendo a:
> r-help-es-ow...@r-project.org
> 
> Si responde a algún contenido de este mensaje, por favor, edite la
> linea del asunto (subject) para que el texto sea mas especifico que:
> "Re: Contents of R-help-es digest...". Además, por favor, incluya en
> la respuesta sólo aquellas partes del mensaje a las que está
> respondiendo.
> 
> Asuntos del día:
> 
> 1. Ayuda con la homocedasticidad de Varianza
> (Francisco Ruben Castaneda Rivero)
> 2. Re: Ayuda con la homocedasticidad de Varianza
> (José Trujillo Carmona)
> 
> --
> 
> Message: 1
> Date: Mon, 13 Jun 2016 19:01:17 -0700
> From: Francisco Ruben Castaneda Rivero <fru...@cicese.edu.mx>
> To: R-help-es@r-project.org
> Subject: [R-es] Ayuda con la homocedasticidad de Varianza
> Message-ID:
> <caddytlsoo48zxplrxr8larweo4pd9072y_yrg0xs4vyh5+0...@mail.gmail.com>
> Content-Type: text/plain; charset="UTF-8"
> 
> Buenas Tardes. He tenido problemas al obtener la Homogenidad de varianza de
> una base de datos ya que tengo 5 Variables bioticas (Especies) y 4
> Abioticas. El ejemplo es la siguiente:
> 
> Especie a Especie b Especie c Especie d  Especie e Profun Conc Temp Sediment
> 0 2 9 14 2 72 4.8 3.5 2
> 26 4 13 11 0 75 2.8 2.5 1
> 0 10 9 8 0 59 5.4 2.7 1
> 0 0 15 3 0 64 8.2 2.9 2
> 13 5 3 10 7 61 3.9 3.1 1
> 31 21 13 16 5 94 2.6 3.5 3
> 9 6 0 11 2 53 4.6 2.9 2
> 2 0 0 0 1 61 5.1 3.3 1
> 17 7 10 14 6 68 3.9 3.4 1
> 0 5 26 9 0 69 10 3 2
> 0 8 8 6 7 57 6.5 3.3 1
> 14 11 13 1 0 84 3.8 3.1 2
> 0 0 19 0 6 53 9.4 3 2
> 13 0 0 9 0 83 4.4 2.5 1
> 4 0 10 12 0 100 6.7 2.8 1
> 42 20 0 3 6 84 2.8 3 3
> 4 0 0 0 0 96 6.4 3.1 1
> 21 15 33 20 0 74 4.4 2.8 3
> 2 5 12 16 3 79 3.1 3.6 2
> 0 10 14 9 0 73 5.6 3 2
> 8 0 0 4 6 59 4.3 3.4 1
> 35 10 0 9 17 54 1.9 2.8 2
> 6 7 1 17 10 95 2.4 2.9 3
> 18 12 20 7 0 64 4.3 3 1
> 32 26 0 23 0 97 2 3 3
> 24 21 0 10 5 78 2.5 3.4 2
> 24 17 0 25 6 85 2.1 3 3
> 16 3 12 20 2 92 3.4 3.3 3
> 11 0 7 8 0 51 6 3 2
> 24 37 5 18 1 99 1.9 2.9 3
> Me gustaria obtener la homogeneidad de varianza por poder realizar un
> Análisis de Correlacción Canónica. El problema es que al utilizar Barlet o
> Levenne test no calcula los valores ya que se necesita una variable
> dependiente y Factor, y al meterlo como especie a y factor abiotico no lo
> calcula. En este caso yo solo quiero obtener la homogeneidad de varianza
> por columna ( si se puede).
> 
> Agradeceria su pronta respuesta y Muchisimas Gracias de antemano.
> 
> [[alternative HTML version deleted]]
> 
> --
> 
> Message: 2
> Date: Tue, 14 Jun 2016 10:51:07 +0200
> From: José Trujillo Carmona <truji...@unex.es>
> To: r-help-es@r-project.org
> Subject: Re: [R-es] Ayuda con la homocedasticidad de Varianza
> Message-ID: <575fc57b.2080...@unex.es>
> Content-Type: text/plain; charset=windows-1252; format=flowed
> 
> No entiendo el problema.
> 
> ¿La cuestión es saber si las distintas variables tienen la misma varianza?
> 
> No es razonables esperar que la Temperatura, la concentración o la 
> profundidad tengan la misma varianza. La varianza tienen unidades y la 
> varianza depende de la unidad de medida. Y no es posible expresar la 
> temperatura en metros de profundidad (ni tendría sentido).
> 
> Por ejemplo la estatura, que en personas se puede distribuir entre 1.5 y 
> 2 metros podría estar en el orden de 0.005 m^2 a 0.007 m^2. Pero si 
> medimos en cm y la estatura está desde los 150 a 200 cm, la varianza 
> estaría entre 50 a 70 cm^2 (cuestión de multiplicar por 100^2) como se 
> estudia en las propiedades básicas de las varianzas.
> 
> Respecto de las variables "Bioticas", supongo que son frecuencias. Pasa 
> lo mismo aunque menos evidente. Aunque las frecuencias tienen siempre 
> como unidad de medida los individuos (quince individuos, siete 
> individuos) su distribución seguirá una distribuc

Re: [R-es] Ayuda con la homocedasticidad de Varianza

2016-06-14 Por tema José Trujillo Carmona

No entiendo el problema.

¿La cuestión es saber si las distintas variables tienen la misma varianza?

No es razonables esperar que la Temperatura, la concentración o la 
profundidad tengan la misma varianza. La varianza tienen unidades y la 
varianza depende de la unidad de medida. Y no es posible expresar la 
temperatura en metros de profundidad (ni tendría sentido).


Por ejemplo la estatura, que en personas se puede distribuir entre 1.5 y 
2 metros podría estar en el orden de 0.005 m^2 a 0.007 m^2. Pero si 
medimos en cm y la estatura está desde los 150 a 200 cm, la varianza 
estaría entre 50 a 70 cm^2 (cuestión de multiplicar por 100^2) como se 
estudia en las propiedades básicas de las varianzas.


Respecto de las variables "Bioticas", supongo que son frecuencias. Pasa 
lo mismo aunque menos evidente. Aunque las frecuencias tienen siempre 
como unidad de medida los individuos (quince individuos, siete 
individuos) su distribución seguirá una distribución de Poisson o algo 
parecido; es decir que su varianza dependerá de su media; o dicho de 
otro modo, de lo abundante que sea la especie.


Si en una muestra esperamos del orden de 20 ejemplares, será fácil que 
los valores reales observados estén entre 10 y 30; pero si esperamos 
solo del orden de cinco valores la varianza no puede ser tan grande como 
en el primer caso por razones obvias (no se puede esperar que el mínimo 
esté a 10 unidades por debajo de la media, sería un número negativo de 
observaciones).


En fin. Si la pregunta es si las distintas variables tienen la misma 
varianza, no necesitas test: No pueden tenerla por la naturaleza de las 
variables.


Si esa no es la pregunta es que no la he entendido. Lo siento.

Saludos.


El 14/06/16 a las 04:01, Francisco Ruben Castaneda Rivero escribió:

Buenas Tardes. He tenido problemas al obtener la Homogenidad de varianza de
una base de datos ya que tengo 5 Variables bioticas (Especies) y 4
Abioticas. El ejemplo es la siguiente:


Especie a Especie b Especie c Especie d  Especie e Profun Conc Temp Sediment
0 2 9 14 2 72 4.8 3.5 2
26 4 13 11 0 75 2.8 2.5 1
0 10 9 8 0 59 5.4 2.7 1
0 0 15 3 0 64 8.2 2.9 2
13 5 3 10 7 61 3.9 3.1 1
31 21 13 16 5 94 2.6 3.5 3
9 6 0 11 2 53 4.6 2.9 2
2 0 0 0 1 61 5.1 3.3 1
17 7 10 14 6 68 3.9 3.4 1
0 5 26 9 0 69 10 3 2
0 8 8 6 7 57 6.5 3.3 1
14 11 13 1 0 84 3.8 3.1 2
0 0 19 0 6 53 9.4 3 2
13 0 0 9 0 83 4.4 2.5 1
4 0 10 12 0 100 6.7 2.8 1
42 20 0 3 6 84 2.8 3 3
4 0 0 0 0 96 6.4 3.1 1
21 15 33 20 0 74 4.4 2.8 3
2 5 12 16 3 79 3.1 3.6 2
0 10 14 9 0 73 5.6 3 2
8 0 0 4 6 59 4.3 3.4 1
35 10 0 9 17 54 1.9 2.8 2
6 7 1 17 10 95 2.4 2.9 3
18 12 20 7 0 64 4.3 3 1
32 26 0 23 0 97 2 3 3
24 21 0 10 5 78 2.5 3.4 2
24 17 0 25 6 85 2.1 3 3
16 3 12 20 2 92 3.4 3.3 3
11 0 7 8 0 51 6 3 2
24 37 5 18 1 99 1.9 2.9 3
Me gustaria obtener la homogeneidad de varianza por poder realizar un
Análisis de Correlacción Canónica. El problema es que al utilizar Barlet o
Levenne test no calcula los valores ya que se necesita una variable
dependiente y Factor, y al meterlo como especie a y factor abiotico no lo
calcula. En este caso yo solo quiero obtener la homogeneidad de varianza
por columna ( si se puede).


Agradeceria su pronta respuesta y Muchisimas Gracias de antemano.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Carlos Ortega
En el menú de RStudio...

Help -> CheatSheets -> R Markdown Cheat Sheet / R Markdown Reference Guide

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 2 de junio de 2016, 15:59, Jorge I Velez 
escribió:

> Hola Jesús,
> Revisa las opciones en http://yihui.name/knitr/options/  Necesitas
> los argumentos fig.width y fig.height.
> Saludos,
> Jorge.-
>
>
>
> 2016-06-02 8:56 GMT-05:00 Jesús Para Fernández <
> j.para.fernan...@hotmail.com
> >:
>
> >
> > Gracias por las respuestas
> >
> > La verdad es qeu estoy trabjando con Rstudio + Knitr, lo unico que en R
> > studio le doy a crear nuevo Sweave, pero is me carga la libreria knitr.
> >
> > Solucioné el problema que os comenté, era por un fallo tonto, a la hora
> de
> > poner datos$A, puse dats$A, es decir, le faltaba la o
> >
> > Ahora una duda que no se como resolver es la de los gráficos. No consigo
> > reducir su tamaño...
> >
> > 

Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Jorge I Velez
Hola Jesús,
Revisa las opciones en http://yihui.name/knitr/options/  Necesitas
los argumentos fig.width y fig.height.
Saludos,
Jorge.-



2016-06-02 8:56 GMT-05:00 Jesús Para Fernández :

>
> Gracias por las respuestas
>
> La verdad es qeu estoy trabjando con Rstudio + Knitr, lo unico que en R
> studio le doy a crear nuevo Sweave, pero is me carga la libreria knitr.
>
> Solucioné el problema que os comenté, era por un fallo tonto, a la hora de
> poner datos$A, puse dats$A, es decir, le faltaba la o
>
> Ahora una duda que no se como resolver es la de los gráficos. No consigo
> reducir su tamaño...
>
> 

Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Jesús Para Fernández

Gracias por las respuestas

La verdad es qeu estoy trabjando con Rstudio + Knitr, lo unico que en R studio 
le doy a crear nuevo Sweave, pero is me carga la libreria knitr.

Solucion� el problema que os coment�, era por un fallo tonto, a la hora de 
poner datos$A, puse dats$A, es decir, le faltaba la o

Ahora una duda que no se como resolver es la de los gr�ficos. No consigo 
reducir su tama�o...


Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Jorge I Velez
Buenos dias Jesús,
 Existe alguna razón especial para no trabajar en RStudio + knitr?  IMO,
es mucho mas fácil y flexible.  Más información en
http://yihui.name/knitr/demo/rstudio/
Saludos,
Jorge.-



2016-06-02 6:10 GMT-05:00 Jesús Para Fernández :

> >Buenas,
>
> Estoy empezando a utilizar latex y hay un par de cosas que no se muy bien
> como hacer ni como buscar en google.
>
> Tengo un data.frame llamado datos con 3 variables, A,B y C
>
> Si pongo
> <<>>
> datos$A
> @
>
> me devuelve error
>
> sin embargo si lo hago con
> <<>>=
> datos[,1]
> @
> me da correctamente. No puedo con Sneave al interior de un data frame
> usando el nombre de las variables con el $???
>
> Gracias!
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Javier Marcuzzi
Estimados

Hay un libro y material al respecto en 
https://github.com/christophergandrud/Rep-Res-Book


Javier Rubén Marcuzzi

De: Carlos Ortega
Enviado: jueves, 2 de junio de 2016 8:45
Para: Jesús Para Fernández
CC: r-help-es@r-project.org
Asunto: Re: [R-es] Ayuda con R Sweave

Hola,

¿No te interesa trabajar todo esto directamente sobre RStudio con
rmarkdown/knitr...?

http://kbroman.org/knitr_knutshell/

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 2 de junio de 2016, 13:10, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> >Buenas,
>
> Estoy empezando a utilizar latex y hay un par de cosas que no se muy bien
> como hacer ni como buscar en google.
>
> Tengo un data.frame llamado datos con 3 variables, A,B y C
>
> Si pongo
> <<>>
> datos$A
> @
>
> me devuelve error
>
> sin embargo si lo hago con
> <<>>=
> datos[,1]
> @
> me da correctamente. No puedo con Sneave al interior de un data frame
> usando el nombre de las variables con el $???
>
> Gracias!
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Carlos Ortega
Hola,

¿No te interesa trabajar todo esto directamente sobre RStudio con
rmarkdown/knitr...?

http://kbroman.org/knitr_knutshell/

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 2 de junio de 2016, 13:10, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> >Buenas,
>
> Estoy empezando a utilizar latex y hay un par de cosas que no se muy bien
> como hacer ni como buscar en google.
>
> Tengo un data.frame llamado datos con 3 variables, A,B y C
>
> Si pongo
> <<>>
> datos$A
> @
>
> me devuelve error
>
> sin embargo si lo hago con
> <<>>=
> datos[,1]
> @
> me da correctamente. No puedo con Sneave al interior de un data frame
> usando el nombre de las variables con el $???
>
> Gracias!
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R Sweave

2016-06-02 Por tema Álvaro Hernández

Buenas,

¿no será que falta el igual después de <<>>? Este código a mí me funciona:

<<>>=
datos$A
@

Saludos, Álvaro

El 02/06/16 a las 13:10, Jesús Para Fernández escribió:

Buenas,

Estoy empezando a utilizar latex y hay un par de cosas que no se muy bien como 
hacer ni como buscar en google.

Tengo un data.frame llamado datos con 3 variables, A,B y C

Si pongo
<<>>
datos$A
@

me devuelve error

sin embargo si lo hago con
<<>>=
datos[,1]
@
me da correctamente. No puedo con Sneave al interior de un data frame usando el 
nombre de las variables con el $???

Gracias!

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


--
Álvaro Hernández Vicente
Sección de Apoyo Estadístico (SAE)
Servicio de Apoyo a la Investigación (SAI)
Vicerrectorado de Investigación
Universidad de Murcia, Murcia, Spain

Edificio SACE, Campus de Espinardo, 30100, Murcia
Email: alvar...@um.es
Telf:  +34 868 88 42 42
Web:   www.um.es/web/sai  www.um.es/ae
Blog:  www.sae.saiblogs.inf.um.es
---

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con Subset

2016-05-23 Por tema Carlos J. Gil Bellosta
Hola, ¿qué tal?

Dos consejos. El primero, que no uses subset
.
Usa corchetes directamente.

El segundo, que utilices el operador %in%:

T[Tv2 %in% c(2,3),]

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 23 de mayo de 2016, 20:00, Rafael Saturno 
escribió:

> Hola Comunidad, tengo este problema con una data
> La data es bastante grande, y necesito filtrarla por un campo en
> especifico segun lo que me interesa,con Subset puedo filtrar de la
> siguiente manera
> T <-
> rbind(data.frame(v1=rep("x",5),v2=sample(1:5)),data.frame(v1=rep("y",5),v2=sample(1:5)))
> ### DATA Ejemplo
> subset(T, v2==2 | v2==3)
> y trae lo que quiero,
> el problema es que en lo que quiero hacer tengo que filtrar por mas de 100
> valores de v2 y muy tedioso escribir todas esas condiciones, sin mencionar
> que me puedo equivocar muy facilmente
> trate de escribirlo
> subset(T, v2==c(2,3))
> pero R recicla el vector y no me trae todos los terminos que quiero
> Gracias xD
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda función plotMF paquete FRBS

2015-11-18 Por tema Víctor Granda García
Hola Bernardo.

Si te da ese error, trata de hacer el panel de graficos de RStudio más
grande. A mi me ha dado ese error al hacer algunos heatmaps grandes y es
simplemente que no puede dibujarlo en el tamaño del panel.

Espero que te sirva, un saludo.


Víctor Granda

El jue., 19 nov. 2015 a las 0:09, Bernardo Mendoza ()
escribió:

> Hola a todos.
> Estoy probando los ejemplos del paquete en RStudio y cada vez que intento
> usar la función plotMV obtengo el error
>
> Error in plot.new() : figure margins too large
> ¿Podría ser un problema de la configuración de RStudio?
>
> Gracias de antemano
>
> Bernardo Mendoza
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda por data.table.

2015-10-01 Por tema Carlos Ortega
Hola Javier,

varias orientaciones:

   - La asignación "DT2 <- DT" no es la forma de compiar un data.table.
  - Para copiar data.tables, existe una función específica para ello
  "copy()". Mira la ayuda de la función para más aclaraciones.
   - En cuanto al rendimiento de data.table respecto a la función básica
   para cambiar a mayúsculas, haría la prueba sin la asignación de "%>%".
   - Sí, la aplicas en los dos casos por lo que no debiera de afectar, pero
  no lo tengo tan claro en el caso de data.table. No he hecho la prueba, es
  una sospecha. Puedes aplicar directamente la función "toupper()" a la
  columna.
  - También en data.table, prueba a crear "setkey()" sobre la columna
  que vas a modificar (V1) antes de hacer el cambio, también creo
que ayudará.


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 1 de octubre de 2015, 16:05, Javier Villacampa González <
javier.villacampa.gonza...@gmail.com> escribió:

> Hola buenas,
>
> hoy me preguntaban que como convertir todas las mayusculas de todas las
> columnas de un data.frame. Buscando soluciones me han surgido multiples
> dudas.
>
>  ###
> Pregunta 1: ¿Cómo funciona := respocto <-?
> ¿por qué cambia en varios data tables un valor mienstras que el otro no lo
> hace?
> ¿Se puede evitar?
>  ###
>
> N <- 10 # numero de checks
> n <- 10
> DF <- data.frame(V1 = sample(x = letters, size = n, replace = T) ,
>  V2 = sample(x = letters, size = n, replace = T) ,
> stringsAsFactors = F)
>
>
> # 1 asginacion clásica 
> DT <- DF %>% data.table()
> DT2 <- DT
> DT2$V1 <- DT2$V1 %>% toupper
> DT2
> DT  # Todo Ok
>
>
>
> # 2 con := 
> DT <- DF %>% data.table()
> DT2 <- DT
> DT2[ , V1 := V1 %>% toupper]
> DT2
> DT  # Cambia ambos ¿Por qué?
>
>  ###
> Pregunta 2:  Soluciones para convertir todas las columnas a mayusculas
> ¿Existen otras mejores? ¿Por qué la asignación base sale la mejor cuando
> los bucles deberían ser la peor opcion?
> ###
>
> library(dplyr)
> library(data.table)
> library(microbenchmark)
>
> N <- 100
> n <- 10
> dt <- data.table(sample(x = letters, size = n, replace = T) ,
>  sample(x = letters, size = n, replace = T) )
>
> # Opcion 1a sapply
> sapply(X = dt,FUN =  toupper)
>
> # Opcion 1b lapply
> lapply(X = dt,FUN =  toupper) %>% data.frame
>
> # Opcion 1c lapply
> apply(X = dt, MARGIN = 2,FUN =  toupper)
>
>
> #  
>
> # Opcion 2 data table. Más rapido cuando los conjuntos son grandes
>
> NAMES <- names(dt)
> dt2 <-dt
>
> dt[ , (NAMES) := lapply(X = .SD, FUN = toupper), .SDcol = NAMES]
>
> dt <- dt2
> # Opcion 3 data table. Más rapido cuando los conjuntos son grandes
> dt %>% mutate_each(funs = funs(toupper) )
>
>
>
> #  
> # Comparaciones C
> N <- 100 # numero de checks
> n <- 10e5
> DF <- data.frame(V1 = sample(x = letters, size = n, replace = T) ,
>  V2 = sample(x = letters, size = n, replace = T) ,
> stringsAsFactors = F)
> DT <- data.table(DF)
>
> NAMES <- names(DF)
> times <- microbenchmark(
>   sapply = DF2 <- sapply(X = DF,FUN =  toupper) ,
>   lapply = DF2 <- lapply(X = DF,FUN =  toupper) %>% data.frame,
>   apply = DF2 <- apply(X = DF, MARGIN = 2,FUN =  toupper),
>   dplyr = DF %>% mutate_each(funs = funs(toupper) )  ,
>   data.table =
> DT[ , (NAMES) := lapply(X = .SD, FUN = toupper), .SDcol = NAMES] ,
>   basicFOR = {
> for(i in 1: ncol(DF)){
>   DF[ , i ] <- DF[ , i ] %>% toupper
> }
>   },
>   data.tableFOR = {
> for(i in names(DT)){
>   DT[ , V1 := V1 %>% toupper]
>   DT[ , V2 := V2 %>% toupper]
> }
>   },
>   times = N, unit = "s")
>
> times %>% print -> times2
> times2[ order(times2$median, decreasing = F), ]
>
>
> # > times2[ order(times2$median, decreasing = F), ]
> # expr   minlq  meanmedianuq   max neval
> cld
> # 4 dplyr 0.1492257 0.1694823 0.2155098 0.2037122 0.2288146
> 0.4119565   100 ab
> # 6  basicFOR 0.1498588 0.1715156 0.2099023 0.2052561 0.2294035
> 0.4420238   100 a
> # 5data.table 0.1560987 0.1701567 0.2322289 0.2194231 0.2690364
> 0.4829464   100 ab
> # 2lapply 0.2239878 0.2565161 0.3288909 0.3034968 0.3578117
> 0.6619332   100  bc
> # 3 apply 0.2396120 0.2809439 0.3578056 0.3280944 0.4196089
> 0.6453446   100   c
> # 7 data.tableFOR 0.3176318 0.3719481 0.4798864 0.4782654 0.5695964
> 0.8311082   100d
> # 1sapply 1.2189397 1.4028805 2.1926634 2.4061735 2.6853981
> 4.8600199   100 e
>
>
> --
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> 

Re: [R-es] ayuda con análisis de supervivencia

2015-08-03 Por tema Griera
Hola:

A que te refieres como el bmi hasta el evento?

Respecto que no sea un tiempo de supervivencia, no eres el único. En este 
artículo tampoco utilizan un tiempo:

http://www.ncbi.nlm.nih.gov/pubmed/8970394

Saludos.


On Sun, 2 Aug 2015 19:19:45 +0200
JM ARBONES marbo...@unizar.es wrote:

 Hola a todos,
 -Estoy estudiando el efecto de dos genotipos (~tratamientos) en la aparición 
 de síndrome metabólico (MetS) con datos longitudinales recogidos a tiempo 
 0,7,10,15,20 y 25 años.
 
 -He hecho un dataframe con las siguientes variables
 MetS: Síndrome Metabólico (Si=1,No=0)
 bmi: Indice de masa corporal (IMC) cuando se produce la conversión a MetS+ . 
 Para los que permancen MetS-, esta variable indica el bmi cuando hay censura 
 (por abandono del estudio o al finalizar el estudio en el año 25).
 bmi0: IMC al inicio del estudio (categórica, levels=normal/overweight/obese)
 apoE4: Genotipo de interés (E4, no-E4)
 
 -Mi hipótesis es que la interacción genotipo~MetS depende del IMC al 
 principio del estudio. Concretamente, individuos 'overweight' al inicio del 
 estudio y con el genotipo E4 hacen la conversión a MetS+ a valores de IMC mas 
 bajos que los que tienen el genotipo no-E4. Este fenómeno no ocurriría en los 
 'normal' y 'obese'.
 
 -He creado unos objetos Surv, pero en lugar de utilizar el tiempo hasta 
 evento (MetS+) estoy utilizando el bmi hasta el evento. Las gráficas que 
 resultan al hacer el análisis de supervivencia parecerían confirmar mi 
 hipótesis, pero no se si lo que estoy haciendo es una aberración estadística. 
 Tampoco se si los coeficientes de la regresión de Cox tienen sentido al no 
 utilizar la variable tiempo.
 
 ?Alguien me podría 1)decir si lo que estoy haciendo tiene sentido y 2) como 
 interpretar los resultados (regresión de Cox y gráficas)?
 Si a alguien se anima a contestar, adjunto un link con los datos (.Rdata) y 
 el script que he utilizado en el análisis.
 
 
 https://www.dropbox.com/s/d96itird8ms42yx/dataframe.Rdata?dl=0 
 https://www.dropbox.com/s/d96itird8ms42yx/dataframe.Rdata?dl=0
 
 sapply(levels(df0$bmi0),function (x){ #SURVIVAL CURVE
   dfx=filter(df0,bmi0==x)
   
   surv2=Surv(dfx$bmi,dfx$MetS)
   km2=survfit(surv2~dfx$apoe4)##start.time=20,type='kaplan')
   plot(km2,lty=2:1,xlim=c(20,41),xlab='BMI at onset',main=x,mark.time = F)
   legend('bottomleft',c('E4','no-E4'),lty=2:1)
   cox=list(coxph(surv2~relevel(dfx$apoe4,ref='no-E4')))
 })
 
 sapply(levels(df0$bmi0),function (x){ #CUMULATIVE HAZARDs
   dfx=filter(df0,bmi0==x)
   
   surv2=Surv(dfx$bmi,dfx$MetS)
   km2=survfit(surv2~dfx$apoe4)
   plot(km2,lty=2:1,xlim=c(20,41),xlab='BMI at onset',main=x,mark.time = 
 F,fun='cumhaz')
   legend('topleft',c('E4','no-E4'),lty=2:1)
   
 })
 
 Muchas gracias y un saludo
 
 Jose Miguel
 
 ---
 
 Jose Miguel Arbones-Mainar, PhD
 Unidad de Investigación Traslacional 
 Instituto Aragones de Ciencias de la Salud 
 Hospital Universitario Miguel Servet 
 Pº Isabel la Católica, 1-3 
 50009 Zaragoza (Spain) 
 Tel: +34 976 769 565
 Fax: +34 976 769 566 
 www.adipofat.com http://www.adipofat.com/
 
 
 
 
 ---
 Jose Miguel Arbones-Mainar
 www.adipofat.com http://www.adipofat.com/
 
 
 
 
 
 
 
   [[alternative HTML version deleted]]
 
 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda con análisis de supervivencia

2015-08-02 Por tema Javier Rubén Marcuzzi
Estimado José Miguel Arbones

Leí su solicitud respecto a un análisis de (Survival) donde quiere medir el 
efecto de dos genotipos en la aparición de un síndrome metabólico. Usted 
también pregunta sobre si estadísticamente sería apropiado ese enfoque.

Leí algo de sobrevida en genética, pero su problema desde mi punto de vista es 
de genética cuantitativa, ¿en que cuantificación tiene que ver el genotipo 
respecto a la medición del síndrome metabólico? Usted habla de genotipo, este 
puede ser homocigota, heterocigota, pero en la gametogénesis solo se heredan 
genes, no genotipos, por lo cuál ¿hay un efecto entre los genes iguales?. En 
otras palabras, efecto aditivo del gen, epistasis, dominancia, etc.

No es justo lenguaje R pero hay un libro en español de Falconer, introducción a 
la genética cuantitativa, luego hay algunos (muchos) paquetes par estos temas 
en R, pero sobrevida sin mezclar algo de terminología de genética cuantitativa, 
a mi me resulta extraño. Por otro lado como usted tiene mediciónes a lo largo 
del tiempo, no hay nada que diga que los efectos del gen son los mismos todo el 
tiempo, si emplea modelos de regresiones aleatorios puede observar que el 
efecto cuantitativo del gen varía, sospecho que el síndrome metabólico puede 
ser observado por ejemplo en el peso, pero este no depende de un gen, hay un 
efecto de muchos genes menores, aunque el que usted quiere analizar puede ser 
un gen mayor (no lo se).

Por lo que usted comenta yo iría sobre el paquete MCMCglmm, posiblemente en los 
ejemplos hay algo que intermedia entre lo que usted plantea, R, y lo que yo 
pienso.

Javier Rubén Marcuzzi
Técnico en Industria Lácteas
Veterinario



De: JM ARBONES
Enviado: domingo, 2 de agosto de 2015 2:19 p. m.
Para: r-help-es@r-project.org
Asunto: [R-es] ayuda con análisis de supervivencia


Hola a todos,
-Estoy estudiando el efecto de dos genotipos (~tratamientos) en la aparición de 
síndrome metabólico (MetS) con datos longitudinales recogidos a tiempo 
0,7,10,15,20 y 25 años.

-He hecho un dataframe con las siguientes variables
MetS: Síndrome Metabólico (Si=1,No=0)
bmi: Indice de masa corporal (IMC) cuando se produce la conversión a MetS+ . 
Para los que permancen MetS-, esta variable indica el bmi cuando hay censura 
(por abandono del estudio o al finalizar el estudio en el año 25).
bmi0: IMC al inicio del estudio (categórica, levels=normal/overweight/obese)
apoE4: Genotipo de interés (E4, no-E4)

-Mi hipótesis es que la interacción genotipo~MetS depende del IMC al principio 
del estudio. Concretamente, individuos 'overweight' al inicio del estudio y con 
el genotipo E4 hacen la conversión a MetS+ a valores de IMC mas bajos que los 
que tienen el genotipo no-E4. Este fenómeno no ocurriría en los 'normal' y 
'obese'.

-He creado unos objetos Surv, pero en lugar de utilizar el tiempo hasta evento 
(MetS+) estoy utilizando el bmi hasta el evento. Las gráficas que resultan al 
hacer el análisis de supervivencia parecerían confirmar mi hipótesis, pero no 
se si lo que estoy haciendo es una aberración estadística. Tampoco se si los 
coeficientes de la regresión de Cox tienen sentido al no utilizar la variable 
tiempo.

?Alguien me podría 1)decir si lo que estoy haciendo tiene sentido y 2) como 
interpretar los resultados (regresión de Cox y gráficas)?
Si a alguien se anima a contestar, adjunto un link con los datos (.Rdata) y el 
script que he utilizado en el análisis.


https://www.dropbox.com/s/d96itird8ms42yx/dataframe.Rdata?dl=0 
https://www.dropbox.com/s/d96itird8ms42yx/dataframe.Rdata?dl=0

sapply(levels(df0$bmi0),function (x){ #SURVIVAL CURVE
  dfx=filter(df0,bmi0==x)
  
  surv2=Surv(dfx$bmi,dfx$MetS)
  km2=survfit(surv2~dfx$apoe4)##start.time=20,type='kaplan')
  plot(km2,lty=2:1,xlim=c(20,41),xlab='BMI at onset',main=x,mark.time = F)
  legend('bottomleft',c('E4','no-E4'),lty=2:1)
  cox=list(coxph(surv2~relevel(dfx$apoe4,ref='no-E4')))
})

sapply(levels(df0$bmi0),function (x){ #CUMULATIVE HAZARDs
  dfx=filter(df0,bmi0==x)
  
  surv2=Surv(dfx$bmi,dfx$MetS)
  km2=survfit(surv2~dfx$apoe4)
  plot(km2,lty=2:1,xlim=c(20,41),xlab='BMI at onset',main=x,mark.time = 
F,fun='cumhaz')
  legend('topleft',c('E4','no-E4'),lty=2:1)
  
})

Muchas gracias y un saludo

Jose Miguel

---

Jose Miguel Arbones-Mainar, PhD
Unidad de Investigación Traslacional 
Instituto Aragones de Ciencias de la Salud 
Hospital Universitario Miguel Servet 
Pº Isabel la Católica, 1-3 
50009 Zaragoza (Spain) 
Tel: +34 976 769 565
Fax: +34 976 769 566 
www.adipofat.com http://www.adipofat.com/




---
Jose Miguel Arbones-Mainar
www.adipofat.com http://www.adipofat.com/







[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



[[alternative 

Re: [R-es] Ayuda boxplot ggplot2

2015-06-16 Por tema Juan Camilo Lara
Muchas gracias, funcionó correctamente.

Att:

Juan Camilo Lara C.

El 16 de junio de 2015, 15:15, pepeceb pepe...@yahoo.es escribió:

 Hola, tienes que añadirlle esta instrucciion
 + ylim (0,60)+

 Saludos


 vplayout - function(x, y) viewport(layout.pos.row = x, layout.pos.col = y)


 tor-ggplot(parasitos, aes(x=Arrenurus, y = torax, fill= Arrenurus)) +

 geom_boxplot(binwidth = 2) +


 geom_boxplot(binwidth = 2) + ylim (0,60)+


 El 16/6/2015 21:54:38, Juan Camilo Lara'juanch...@gmail.com' escribió:
 Hola a todos

 Me gustaría saber si me pueden ayudar con lo siguiente.

 Realicé un Boxplot usando ggplot2 para visualizar el comportamiento de dos
 variables. Visualmente no se notan las diferencias porque la gráfica de la
 derecha (parásitos en el abdomen) llega hasta 20 en el eje y. ¿Cómo puedo
 hacer para que las dos gráficas muestren la misma escala en el eje Y, es
 decir, que las dos lleguen a 60?

 Adjunto el boxplot y a continuación el código que usé para producirlo.

 vplayout - function(x, y) viewport(layout.pos.row = x, layout.pos.col = y
 )


 tor-ggplot(parasitos, aes(x=Arrenurus, y = torax, fill= Arrenurus)) +

 geom_boxplot(binwidth = 2) +

 scale_fill_manual(values = c(lightgreen, lightblue))+

 ylab(Total parásitos)+

 xlab()+

 ggtitle(Parásitos en el tórax)

 abd- ggplot(parasitos, aes(x=Arrenurus, y = abdomen, fill= Arrenurus)) +

 geom_boxplot(binwidth = 2) +

 scale_fill_manual(values = c(lightgreen, lightblue))+

 ylab(Total parásitos)+

 xlab()+

 ggtitle(Parásitos en el abdomen)


 grid.newpage()

 pushViewport(viewport(layout = grid.layout(1, 2)))

 print(tor, vp = vplayout(1, 1))

 print(abd, vp = vplayout(1, 2))



 Gracias por su ayuda


 Att: Juan Camilo Lara C.



[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda boxplot ggplot2

2015-06-16 Por tema pepeceb
 text/html; charset=iso-8859-1: Unrecognized 
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda identificación elementos en el cluster

2015-01-04 Por tema Carlos J. Gil Bellosta
Hola, ¿qué tal?

Tu problema es que lo que llamas nombre es un factor. Mira esto:

 cat(iris$Species[1])
1

 cat(as.character(iris$Species[1]))
setosa

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 4 de enero de 2015, 10:39, Jose Manuel Veiga del Baño
chem...@um.es escribió:
 Hola a todos,

 Tengo un problema, que no consigo solucionar. En el análisis cluster de
 280 elementos lo hago mediante la secuencia:

   library(cluster)
   clusplot(mydata2, fit2$cluster, color=TRUE, shade=TRUE,
labels=2, lines=0)
 La representacion de los 280 elementos lo hace de forma adecuada, cambiando
 el nombre del elemento por el número. Ahora bien necesitaría saber que
 nombre de elemento le corresponde con ese elemento, para ello lo hago
 mediante:
 clusters-sapply(unique(groups),function(x)mydata2$PESTICIDA[groups == x])
 pero cuando intento sacar que nombre le corresponde a ese número, siempre
 me devuelve el número, no consigo sacar el nombre. Es decir si hago
 clusterx[k,1] me sale el nombre pero al meterlo para que me lo informe con
 cat, me sale otra vez el número:
for (j in 1:ncluster){
  clusterx-data.frame(clusters[j])
  cat(Numero de cluster=,j, \n)
  for (k in 1:nrow(clusterx)){
  cat(clusterx[k,1], sep=//)
  }
}

 He mirado pero no consigo encontrar la forma de poder identificar el
 elemento. ¿Alguien se ha encontrado con el problema o sabría como
 solucionarlo?

 Muchas gracias.

 Dr. José M. Veiga
 Dpt. Química Agrícola, Geología y Edafología.
 Universidad de Murcia.

 [[alternative HTML version deleted]]

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda prueba de significancia funcion nls()

2014-10-17 Por tema Carlos J. Gil Bellosta
Hola, ¿qué tal?

Hu... no conozco ese modelo que tratas de ajustar demasiado bien,
pero creo que el parámetro A significa demasiadas cosas (y depende de
demasiadas cosas) a la vez. Por ejemplo, seguro, está muy
correlacionado con alfa porque opera como una especie de término
independiente de lo que hay dentro de exp y su valor depende mucho,
por ejemplo, de si normalizas o no la edad.

Yo buscaría una formulación o reparametrización alternativa.

Pero en este caso en particular, parecía claro que el problema estaba
en la falta de ajuste en esa cola poco relevante.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 16 de octubre de 2014, 22:12, Boris Polanco
borisc...@gmail.com escribió:
 Hola, he vuelto a realizar el ajuste con la sugerencia que me diste y ha
 funcionado, pero mi pregunta es si para con otro modelo similar no  me sale
 un parámetro no significativo, cómo interpreto el no rechazo de la hipótesis
 nula?

 saludos

 El 15 de octubre de 2014, 17:44, Carlos J. Gil Bellosta
 c...@datanalytics.com escribió:

 Hola, ¿qué tal?

 Yo eliminaría las observaciones por encima de los noventaitantos (¿o
 cien?) años. Son solo ruido, como puede observarse. Estarán basadas en
 un porcentaje nimio de la muestra.

 Igual entonces cambian las cosas.

 Un saludo,

 Carlos J. Gil Bellosta
 http://www.datanalytics.com


 El día 15 de octubre de 2014, 23:18, Boris Polanco
 borisc...@gmail.com escribió:
  Hola, estoy haciendo un estudio de la desaceleración de la mortalidad y
  tengo dudas con la función nls(), adjunto un archivo donde he redactado
  mi
  inquietud.
 
  saludos cordiales
  Boris Polanco
 
  ___
  R-help-es mailing list
  R-help-es@r-project.org
  https://stat.ethz.ch/mailman/listinfo/r-help-es
 



___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda por favor

2014-07-30 Por tema Carlos Ortega
Hola,

Creo que si sigues las recomendaciones que aparecen en esta referencia,
aumentarán mucho las posibilidades de que te podamos ayudar:

http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example

Saludos,
Carlos Ortega
www.qualityexcellence.es


2014-07-29 8:47 GMT+02:00 A. Robles R. albert.phy...@gmail.com:

 Cambie mi sintaxis de entrada a:
 input-list.files(path=.,.hdf,all.files=T,recursive=T)

 y ahora mi error es:

  reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,+
 resample_type=NEAREST_NEIGHBOR,+
 proj_type=GEO,datum='WGS84')**

 MODIS Reprojection Tool (v4.1 March 2009)
 Start Time:  Tue Jul 29 01:37:37 2014

 --

 Warning: gctp_call : Environmental Variable Not Found
  : MRT_DATA_DIR nor MRTDATADIR not defined
 Error: GetInputGeoCorner : General Processing
  : Error converting input projection coordinates to lat/long
 coordinates.
 Fatal Error, Terminating...
 [1] FALSE



 2014-07-29 1:24 GMT-05:00 A. Robles R. albert.phy...@gmail.com:

  Saludos, estoy intentando usar la función reprojectHDF() (
  http://r-gis.net/?q=ModisDownload).
 
  
  source('ModisDownload.R')
  library(raster)
  library(RCurl)
  path-~/R/MODIS/Data/Test
  input-list.files(path,*.hdf,all.files=T,recursive=T,full.names=T)
  input
  outname-paste(substr(input[1],40,45),.tif,sep='')
  outname
  reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,
  resample_type=NEAREST_NEIGHBOR,
  proj_type=GEO,datum='WGS84')
  
  Pero me resulta el siguiente mensaje de error:
  
   reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,
  + resample_type=NEAREST_NEIGHBOR,
  + proj_type=GEO,datum='WGS84')
 
 
 **
  MODIS Reprojection Tool (v4.1 March 2009)
  Start Time: Tue Jul 29 00:57:18 2014
  --
  Error: ReadHDFHeader : Opening Input Header File
  : Unable to open
 
 /home/rral/R/MODIS/Data/Test//home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v08.005.2008238073751.hdf
  Fatal Error, Terminating...
  [1] FALSE
  
  Toda sugerencia es bienvenida.
  
  PD: mis variables de entrada son:
   input
  [1]
 
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v08.005.2008238073751.hdf
  [2]
 
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v09.005.2008238081536.hdf
  [3]
 
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h10v08.005.2008238053313.hdf
  [4]
 
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h10v09.005.2008238061408.hdf
  y
   outname
  [1] 265.tif
 
  --
  *Atte:*   *A. Robles R.*
 



 --
 *Atte:*   *A. Robles R.*

 [[alternative HTML version deleted]]


 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es




-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda por favor

2014-07-29 Por tema A. Robles R.
Cambie mi sintaxis de entrada a:
input-list.files(path=.,.hdf,all.files=T,recursive=T)

y ahora mi error es:

 reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,+ 
 resample_type=NEAREST_NEIGHBOR,+ 
 proj_type=GEO,datum='WGS84')**

MODIS Reprojection Tool (v4.1 March 2009)
Start Time:  Tue Jul 29 01:37:37 2014

--

Warning: gctp_call : Environmental Variable Not Found
 : MRT_DATA_DIR nor MRTDATADIR not defined
Error: GetInputGeoCorner : General Processing
 : Error converting input projection coordinates to lat/long coordinates.
Fatal Error, Terminating...
[1] FALSE



2014-07-29 1:24 GMT-05:00 A. Robles R. albert.phy...@gmail.com:

 Saludos, estoy intentando usar la función reprojectHDF() (
 http://r-gis.net/?q=ModisDownload).

 
 source('ModisDownload.R')
 library(raster)
 library(RCurl)
 path-~/R/MODIS/Data/Test
 input-list.files(path,*.hdf,all.files=T,recursive=T,full.names=T)
 input
 outname-paste(substr(input[1],40,45),.tif,sep='')
 outname
 reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,
 resample_type=NEAREST_NEIGHBOR,
 proj_type=GEO,datum='WGS84')
 
 Pero me resulta el siguiente mensaje de error:
 
  reprojectHDF(hdfName=input,filename=outname,MRTpath=~/MRT/bin,
 + resample_type=NEAREST_NEIGHBOR,
 + proj_type=GEO,datum='WGS84')

 **
 MODIS Reprojection Tool (v4.1 March 2009)
 Start Time: Tue Jul 29 00:57:18 2014
 --
 Error: ReadHDFHeader : Opening Input Header File
 : Unable to open
 /home/rral/R/MODIS/Data/Test//home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v08.005.2008238073751.hdf
 Fatal Error, Terminating...
 [1] FALSE
 
 Toda sugerencia es bienvenida.
 
 PD: mis variables de entrada son:
  input
 [1]
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v08.005.2008238073751.hdf
 [2]
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h09v09.005.2008238081536.hdf
 [3]
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h10v08.005.2008238053313.hdf
 [4]
 /home/rral/R/MODIS/Data/Test/MOD13Q1.A265.h10v09.005.2008238061408.hdf
 y
  outname
 [1] 265.tif

 --
 *Atte:*   *A. Robles R.*




-- 
*Atte:*   *A. Robles R.*

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda Error in `colnames-`(`*tmp*`, value = c(

2014-07-23 Por tema daniel
Alfredo,

Insisto que me parece que usas el paquete tm o alguno similar de text
mining. No uso ese paquete frecuentemente, por lo que recuerdo tenia sus
funciones especiales. Intenta armar un ejemplo reproducible con algun texto
que se pueda compartir.

respecto de los dimnames, colnames y rownames de una matriz espero este
ejemplo te sirva:

m - matrix( c(1,2,3,4), ncol=2, dimnames=list( fila = c('1','2'), columna
= c('A', 'B')))
m
str(m)
class(m)

Daniel Merino


El 23 de julio de 2014, 14:59, Alfredo David Alvarado Ríos 
david.alvarad...@gmail.com escribió:

 Buenas tardes Daniel, estoy muy agradecido por tu atención y tu
 sugerencia. En ese sentido, copio lo que devuelve la consola con la
 orden que me recomendaste:

  m-as.matrix(tdm)
  str(m)
  num [1:3530, 1:1224] 0 0 0 0 0 0 0 0 0 0 ...
  - attr(*, dimnames)=List of 2
   ..$ Terms: chr [1:3530] 000 010405 010705 011004 ...
   ..$ Docs : chr [1:1224] 1 2 3 4 ...

 Aparentemente, la matriz está conformada por una lista de 2 objetos,
 d1 y d2, no es cierto? Me equivoco? La diferencia es que uno es una
 especie de secuencia del 1 al 3530 y el otro del 1 al 1224.

 Alguna otra idea?

 He tratado de ubicar información que me sirva al respecto.

 En este momento, me pregunto si tiene que ver con la opción dimnames,
 que según leí es por defecto NULL en el comando matrix, que me parece
 es lo que lleva a cabo el comando as.matrix, sólo que asumiendo todas
 las opciones por defecto que trae el comando. Y realmente no logro
 ubicar si el asunto lo resuelvo con as.matrix, matrix, o por colnames.

 Lancé un comando para ver si lo veía como una matrix:

  is.matrix(m)
 [1] TRUE


 Experimenté con:

  m-as.matrix((tdm), dimnames=list) ## Y no sirvió.

  m-as.matrix(tdm, ncol=2, dimnames=list) ##  Y tampoco sirvió.
  colnames(m) = c(P05, P13)
 Error in `colnames-`(`*tmp*`, value = c(P05, P13)) :
   length of 'dimnames' [2] not equal to array extent


 Sigo buscando información, pero aún no doy con algo que me indique por
 donde puedo resolverlo.
 Gracias anticipadas.


 El día 22 de julio de 2014, 18:11, daniel daniel...@gmail.com escribió:
  Supongo que estas usando el paquete tm. Con ese paquete llegas sin
 errores a
  la matriz m. Aparentemente tu crees que la matriz m tiene dos columnas.Te
  podria ser util ver que pasa con esa matriz, por ejemplo con str(m).
 
  Espero te sirva,
 
  Daniel Merino
 
 
  El 22 de julio de 2014, 18:29, Alfredo David Alvarado Ríos
  david.alvarad...@gmail.com escribió:
 
  Buenas tardes, grupo.
  Estoy tratando de hacer la comparación de dos archivos de una misma
  organización para encontrar las diferencias entre su informe del tema
  edl año 2005 y el del año 2013:
 
 
  Todos los comandos van bien, a exepción del último colnames, como se
  ve en la siguiente secuencia:
 
   pdf1-./PLAN de INSPECCIONES/05_seguridad_ciudadana.pdf
   pdf2-./PLAN de INSPECCIONES/2013_21SeguridadCiudadana.pdf
   exe-./xpdfbin-win-3.04/xpdfbin-win-3.04/bin32/pdftotext.exe
   system(paste(\, exe, \ \, pdf1, \, sep = ), wait = F)
   system(paste(\, exe, \ \, pdf2, \, sep = ), wait = F)
   txt1-sub(.pdf, .txt, pdf1)
   txt2-sub(.pdf, .txt, pdf2)
   d1-readLines(txt1, encoding=UTF-8)
   d1-iconv(enc2utf8(d1), sub = byte)
   d2-readLines(txt2, encoding=UTF-8)
   d2-iconv(enc2utf8(d2), sub = byte)
   df-c(d1,d2)
   corpus-Corpus(VectorSource(df))
   d-tm_map(corpus, content_transformer(tolower))
   d-tm_map(d, stripWhitespace)
   d-tm_map(d, removePunctuation)
   sw-readLines(./StopWords.txt, encoding=UTF-8)
   sw-iconv(enc2utf8(sw), sub=byte)
   d-tm_map(d, removeWords, sw)
   d-tm_map(d, removeWords, stopwords(spanish))
   tdm-TermDocumentMatrix(d)
   m-as.matrix(tdm)
   colnames(m) = c(P05, P13)
  Error in `colnames-`(`*tmp*`, value = c(P05, P13)) :
length of 'dimnames' [2] not equal to array extent
 
  Mi pregunta es acerca de ese error. Por lo que entiendo, R no puede
  correr exitosamente el comando que se le indica porque la longitud  de
  los valores P05 y P13 (los dos informes) no es la misma para el
  sistema.
 
  Alguna ayuda que pueda orientarme al respecto, por favor? Lo que
  necesito es hacer esa tarea con colnames para poder seguir con el
  ejercicio comparativo. Muchas gracias por la ayuda.
 
  ___
  R-help-es mailing list
  R-help-es@r-project.org
  https://stat.ethz.ch/mailman/listinfo/r-help-es
 
 
 
 
  --
  Daniel




-- 
Daniel

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda Error in `colnames-`(`*tmp*`, value = c(

2014-07-22 Por tema daniel
Supongo que estas usando el paquete tm. Con ese paquete llegas sin errores
a la matriz m. Aparentemente tu crees que la matriz m tiene dos columnas.Te
podria ser util ver que pasa con esa matriz, por ejemplo con str(m).

Espero te sirva,

Daniel Merino


El 22 de julio de 2014, 18:29, Alfredo David Alvarado Ríos 
david.alvarad...@gmail.com escribió:

 Buenas tardes, grupo.
 Estoy tratando de hacer la comparación de dos archivos de una misma
 organización para encontrar las diferencias entre su informe del tema
 edl año 2005 y el del año 2013:


 Todos los comandos van bien, a exepción del último colnames, como se
 ve en la siguiente secuencia:

  pdf1-./PLAN de INSPECCIONES/05_seguridad_ciudadana.pdf
  pdf2-./PLAN de INSPECCIONES/2013_21SeguridadCiudadana.pdf
  exe-./xpdfbin-win-3.04/xpdfbin-win-3.04/bin32/pdftotext.exe
  system(paste(\, exe, \ \, pdf1, \, sep = ), wait = F)
  system(paste(\, exe, \ \, pdf2, \, sep = ), wait = F)
  txt1-sub(.pdf, .txt, pdf1)
  txt2-sub(.pdf, .txt, pdf2)
  d1-readLines(txt1, encoding=UTF-8)
  d1-iconv(enc2utf8(d1), sub = byte)
  d2-readLines(txt2, encoding=UTF-8)
  d2-iconv(enc2utf8(d2), sub = byte)
  df-c(d1,d2)
  corpus-Corpus(VectorSource(df))
  d-tm_map(corpus, content_transformer(tolower))
  d-tm_map(d, stripWhitespace)
  d-tm_map(d, removePunctuation)
  sw-readLines(./StopWords.txt, encoding=UTF-8)
  sw-iconv(enc2utf8(sw), sub=byte)
  d-tm_map(d, removeWords, sw)
  d-tm_map(d, removeWords, stopwords(spanish))
  tdm-TermDocumentMatrix(d)
  m-as.matrix(tdm)
  colnames(m) = c(P05, P13)
 Error in `colnames-`(`*tmp*`, value = c(P05, P13)) :
   length of 'dimnames' [2] not equal to array extent

 Mi pregunta es acerca de ese error. Por lo que entiendo, R no puede
 correr exitosamente el comando que se le indica porque la longitud  de
 los valores P05 y P13 (los dos informes) no es la misma para el
 sistema.

 Alguna ayuda que pueda orientarme al respecto, por favor? Lo que
 necesito es hacer esa tarea con colnames para poder seguir con el
 ejercicio comparativo. Muchas gracias por la ayuda.

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es




-- 
Daniel

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda con unexpected symbol

2014-05-29 Por tema miguel.angel.rodriguez.muinos
Hola Marta.

Tiene pinta de faltar una coma


DBxy-read.csv(paste(C:/users/marta/desktop/DB,filename, 
sep=),sep=,,header=TRUE)

Un Saludo,
Miguel.






De: r-help-es-boun...@r-project.org [r-help-es-boun...@r-project.org] en nombre 
de Marta valdes lopez [martavalde...@gmail.com]
Enviado: jueves, 29 de mayo de 2014 18:49
Para: r-help-es@r-project.org
Asunto: [R-es] ayuda con unexpected symbol

Hola,

Tengo la version R 3.1, estoy intentado usar este script pero me dice que
el simbolo  no tiene que estar ahi, ya intente borrando comillas o
diferentes formas y no lo consigo, si alguien sabe agradezco ayuda.

setwd(C:/users/marta/desktop/DB)
 library(chron)
  library(xlsx)
 filename-univerest_50.csv
  filename-monicap_50.csv
  filename-univer1_50.csv
  filename-univer2_50.csv
DBxy-read.csv(paste(C:/users/marta/desktop/DB,filename, sep=)
sep=,,header=TRUE)

Yen esta linea es cuando me dice que unexpected symbol 

Gracias

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Nota: A información contida nesta mensaxe e os seus posibles documentos 
adxuntos é privada e confidencial e está dirixida únicamente ó seu 
destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por 
favor elimínea. A distribución ou copia desta mensaxe non está autorizada.

Nota: La información contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y está dirigida únicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elimínelo. La distribución o copia de este mensaje no está autorizada.

See more languages: http://www.sergas.es/aviso_confidencialidad.htm

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda con unexpected symbol

2014-05-29 Por tema Marta valdes lopez
Hola,

Gracias por la rapida respuesta.Si pongo la coma, me dice:
Error in file(file,rt):cannot open the connection
in addition :warning message:
in file(file,rt):
cannot open file c:/users/marta/desktop/DB,univer2_50.csv:no such file or
directory

No se porque me adjunta el ultimo archivo...algo hago mal con el working
directoy pero no se que.

Gracias un saludo


El 29 de mayo de 2014, 19:09, miguel.angel.rodriguez.mui...@sergas.es
escribió:

 Hola Marta.

 Tiene pinta de faltar una coma


 DBxy-read.csv(paste(C:/users/marta/desktop/DB,filename,
 sep=),sep=,,header=TRUE)

 Un Saludo,
 Miguel.





 
 De: r-help-es-boun...@r-project.org [r-help-es-boun...@r-project.org] en
 nombre de Marta valdes lopez [martavalde...@gmail.com]
 Enviado: jueves, 29 de mayo de 2014 18:49
 Para: r-help-es@r-project.org
 Asunto: [R-es] ayuda con unexpected symbol

 Hola,

 Tengo la version R 3.1, estoy intentado usar este script pero me dice que
 el simbolo  no tiene que estar ahi, ya intente borrando comillas o
 diferentes formas y no lo consigo, si alguien sabe agradezco ayuda.

 setwd(C:/users/marta/desktop/DB)
  library(chron)
   library(xlsx)
  filename-univerest_50.csv
   filename-monicap_50.csv
   filename-univer1_50.csv
   filename-univer2_50.csv
 DBxy-read.csv(paste(C:/users/marta/desktop/DB,filename, sep=)
 sep=,,header=TRUE)

 Yen esta linea es cuando me dice que unexpected symbol 

 Gracias

 [[alternative HTML version deleted]]

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

 

 Nota: A información contida nesta mensaxe e os seus posibles documentos
 adxuntos é privada e confidencial e está dirixida únicamente ó seu
 destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
 por favor elimínea. A distribución ou copia desta mensaxe non está
 autorizada.

 Nota: La información contenida en este mensaje y sus posibles documentos
 adjuntos es privada y confidencial y está dirigida únicamente a su
 destinatario/a. Si usted no es el/la destinatario/a original de este
 mensaje, por favor elimínelo. La distribución o copia de este mensaje no
 está autorizada.

 See more languages: http://www.sergas.es/aviso_confidencialidad.htm


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ayuda con unexpected symbol ... correcion omiti un paso ...

2014-05-29 Por tema neo
perdon, me salte el paso de lectura del contenido del fichero, corrijo
aqui lo que envie:


setwd(C:/users/marta/desktop/DB)

filename - list.files(path = C:/users/marta/desktop/DB)

# este paso es solo para crear un fichero con la misma cantidad de
columnas que los que quieres unir, luego puedes borrar esa primera fila

tmp - read.csv(filenames[1], nrows=1)

# ahora se uniran a ese temporal todo el resto de los ficheros del
directorio, pegando las filas hacia abajo

i - 1
for (i in 1:(length(filenames)))
{
# aqui tienes que acomodar la lectura del fichero de acuerdo a tu
necesidad, por ejemplo, si necesitas que lea como encabezado la primera
fila header=TRUE y todo eso que sale en la ayuda de la funcion

tmp2 - read.csv(filenames[i])
tmp - rbind(tmp,tmp2)
i - i+1

}


ahora si espero que sirva,

slds,

eric.




On 29/05/14 13:40, Marta valdes lopez wrote:
 Si asi funciono¡ pero mi pregunta ahora es como hago para que me lea los 4
 ficheros, porque lo que quiero es integrar los 4 excels en uno que seria el
 DBxy, y por eso utilice el xlsx, porque si pongo diferentes nombres a
 filename me los pondria en diferentes archivos no?
 
 Muchas gracias¡
 
 
 El 29 de mayo de 2014, 19:25, miguel.angel.rodriguez.mui...@sergas.es
 escribió:
 
 Revisando tu mensaje con más detenimiento (y no sólo en la coma a la que
 me refería en el correo anterior) veo que el código que adjuntas de ejemplo
 es algo confuso

 Al usar setwd() al principio ya no necesitas luego el paste() dentro del
 read.csv() ... así se te complica la cosa (incluso llego a adivinar que
 falta un slash al final), llega con que le especifiques el nombre del
 fichero porque estás ya en ese directorio de trabajo).
 Por otro lado, asignas 4 valores distintos a la variable 'filename' por lo
 que se quedará con el último valor (univer2_50.csv).
 Resumiendo: tu código podría quedar así con idéntico resultado:

 setwd(C:/users/marta/desktop/DB)
 filename-univer2_50.csv
 DBxy-read.csv(filename, sep=,, header=TRUE)

 Un Saludo,
 Miguel.




 
 De: r-help-es-boun...@r-project.org [r-help-es-boun...@r-project.org] en
 nombre de Marta valdes lopez [martavalde...@gmail.com]
 Enviado: jueves, 29 de mayo de 2014 18:49
 Para: r-help-es@r-project.org
 Asunto: [R-es] ayuda con unexpected symbol

 Hola,

 Tengo la version R 3.1, estoy intentado usar este script pero me dice que
 el simbolo  no tiene que estar ahi, ya intente borrando comillas o
 diferentes formas y no lo consigo, si alguien sabe agradezco ayuda.

 setwd(C:/users/marta/desktop/DB)
  library(chron)
   library(xlsx)
  filename-univerest_50.csv
   filename-monicap_50.csv
   filename-univer1_50.csv
   filename-univer2_50.csv
 DBxy-read.csv(paste(C:/users/marta/desktop/DB,filename, sep=)
 sep=,,header=TRUE)

 Yen esta linea es cuando me dice que unexpected symbol 

 Gracias

 [[alternative HTML version deleted]]

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

 

 Nota: A información contida nesta mensaxe e os seus posibles documentos
 adxuntos é privada e confidencial e está dirixida únicamente ó seu
 destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
 por favor elimínea. A distribución ou copia desta mensaxe non está
 autorizada.

 Nota: La información contenida en este mensaje y sus posibles documentos
 adjuntos es privada y confidencial y está dirigida únicamente a su
 destinatario/a. Si usted no es el/la destinatario/a original de este
 mensaje, por favor elimínelo. La distribución o copia de este mensaje no
 está autorizada.

 See more languages: http://www.sergas.es/aviso_confidencialidad.htm

 
   [[alternative HTML version deleted]]
 
 
 
 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es
 

-- 
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city
standards for living

Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
lectores de correo.

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es