from:"Carlos J. Gil Bellosta"

Re: [R-es] Depuración de código

2024-02-07 Por tema Carlos J. Gil Bellosta

Prueba algo así:

##

P1 <- data.frame(
  Cantidad = 0:10,
  UtilidadA = c(0,15,28,35,40,45,49,53,55,56,56),
  UtilidadB = c(0,17,30,37,42,47,51,55,57,58,58)
)

PrecioA <- 12
PrecioB <- 16
L_prep <- 90

out <- expand.grid(cant_a = 0:10, cant_b = 0:10)

out <- merge(out, P1[, c("Cantidad", "UtilidadA")], by.x = "cant_a", by.y=
"Cantidad")
out <- merge(out, P1[, c("Cantidad", "UtilidadB")], by.x = "cant_b", by.y=
"Cantidad")

out$utilidad <- out$UtilidadA + out$UtilidadB
out$precio <- out$cant_a * PrecioA + out$cant_b * PrecioB

out <- out[out$precio <= L_prep,]
out <- out[order(out$utilidad),]
tail(out, 1)

##

Se puede hacer mejor, pero es lo suficientemente bueno.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El mié, 7 feb 2024 a las 2:28, Clei Y () escribió:

> Hola a todos
>
> Empleando mis limitados conocimientos de R pude resolver un ejercicio
> elaborando un código, estoy seguro que se puede simplificar, si alguien
> tiene algún tiempo libre agradecería me pudiera ayudar depurando el código,
> lo adjunto junto con unas tablas que representan el inicio y final.
>
> El ejercicio consiste en calcular la cantidad ideal de los Productos A y
> B, considerando su precio, el límite presupuestario y la utilidad que
> representan.
>
> Saludos.
>
>
> ### Creamos data_frame de cantidad y utilidad ###
>
> P1 <- data.frame(
>
> "Cantidad"= 0:10,
>
> "UtilidadA" = c("0","15","28","35","40","45","49","53","55","56","56"),
>
> "UtilidadB" = c("0","17","30","37","42","47","51","55","57","58","58"))
>
> Q
> UtilidadA
> UtilidadB
> 0
> 0
> 0
> 1
> 15
> 17
> 2
> 28
> 30
> 3
> 35
> 37
> 4
> 40
> 42
> 5
> 45
> 47
> 6
> 49
> 51
> 7
> 53
> 55
> 8
> 55
> 57
> 9
> 56
> 58
> 10
> 56
> 58
>
>
>
>
> ### Creamos variables de precio y límite presupuestario ###
>
> PrecioA <- 12
>
> PrecioB <- 16
>
> L_prep <- 90
>
>
>
> ### cambiamos clase ###
>
> P1$UtilidadA <- as.numeric(P1$UtilidadA)
>
> P1$UtilidadB <- as.numeric(P1$UtilidadB)
>
>
>
> ### Creamos vector de gasto en producto A ###
>
> Gasto_PA <- numeric(length(P1$Cantidad))
>
> for(i in 1:length(P1$Cantidad)){
>
> Gasto_PA[i]  <- round((P1$Cantidad[i] *PrecioA),digits = 0)
>
> }
>
>
>
> ### Creamos vector de unidades B con relación a A ###
>
> CestaB <- numeric(length(Gasto_PA))
>
> for (i in 1:length(Gasto_PA)) {
>
> CestaB[i] <- round(((L_prep-Gasto_PA[i])/PrecioB),digits = 0)
>
> }
>
>
>
> ### Creamos vector de utilidad total ###
>
> library(dplyr)
>
>
>
> ## Del primer data frame obtenemos cantidad y utilidad de B ###
>
> > P2 <- data.frame(P1$Cantidad, P1$UtilidadB)
>
>
>
> ## Del primer data frame obtenemos cantidad y utilidad de A ###
>
> p3 <- select(P1,Cantidad,UtilidadA)
>
>
>
> ## Cambiamos nombre de columnas y tipo para unir data_frame ##
>
> CestaB <- data.frame(CestaB)
>
> colnames(CestaB)[1] <- "P1.Cantidad"
>
>
>
> ## Unimos Unidades de B con su utilidad manteniendo el orden ##
>
> P4 <- merge.data.frame(x=CestaB, y=P2, all.x = TRUE, sort = F)
>
>
>
> ## Unimos data frame de cantidad y utilidad de A con cantidad y utilidad
> de B ##
>
> P5 <- cbind(p3,P4)
>
>
>
> ## Renombramos columnas ##
>
> colnames(P5)[1] <- "CantidadA"
>
> colnames(P5)[3] <- "CantidadB"
>
> colnames(P5)[4] <- "UtilidadB"
>
>
>
> ## Creamos columna de utilidad total ##
>
> ## Este data frame muestra las combinaciones de A y B que se pueden
> adquirir con el límite presupuestario y la utilidad##
>
> P5$Utilidad_Total <- P5$UtilidadA+P5$UtilidadB
>
> CantidadA
> UtilidadA
> CantidadB
> UtilidadB
> Utilidad_Total
> 0
> 0
> 5
> 47
> 47
> 1
> 15
> 4
> 42
> 57
> 2
> 28
> 4
> 42
> 70
> 3
> 35
> 3
> 37
> 72
> 4
> 40
> 2
> 30
> 70
> 5
> 45
> 1
> 17
> 62
> 6
> 49
> 1
> 17
> 66
> 7
> 53
> 0
> 0
> 53
> 8
> 55
> 0
> 0
> 55
> 9
> 56
> -1
> NA
> NA
> 10
> 56
> -1
> NA
> NA
>
>
>
> ## Identificamos utilidad total máxima ##
>
> utilidad_max <- which.max(P5$Utilidad_Total)
>
>
>
> ## Creamos data frame con combinación de A y B que entrega utilidad máxima
> ##
>
> fila_max <- P5[utilidad_max, ]
>
> print(fila_max)
>
> class(fila_max)
>
> ## Este data frame sería la salida en ShinyApp ##
>
>
> Gracias y saludos
>
> Cleiver Yam
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Espcificar analisis de medidas repetidas en lme()

2022-01-11 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Yo uso lmer habitualmente (y no lme) y me pierdo un poco con la sintaxis.
Pero vamos, casi seguro que lme no espera que "visita" figure en el modelo.

Tampoco está claro si quieres que los sitios sean efectos fijos o
aleatorios. Casi me inclino más por lo segundo, pero no sé cuál es el
contexto exacto. De todos modos, tienes un ejemplo similar al tuyo tratado
con lmer aqui <http://www.alexanderdemos.org/Mixed5.html> (sección *3 Level
Random intercepts model*).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com
.

El mar, 11 ene 2022 a las 14:24, Jaume Tormo ()
escribió:

> Hola,
>
> Estoy tratando de especificar un modelo de medidas repetidas que es como
> sigue:
> - 4 sitios de estudio. (A-D)
> - Dentro de cada sitio hay 5 puntos donde se mide la variable X
> - Repetimos las medidas en el tiempo. Los lugares y puntos son los mismos
> en cada visita.
>
> Tenemos las siguientes variables:
> id - identificador del punto de medida
> sitio - Los cuatro lugares donde se mide sitio1, sitio2, ... sitio4
> visita - La visitas que se hacen para medir. visita1, visita2,... visitaN
> x - variable medida
>
> Lo voy a analizar con lme pero no estoy seguro de cómo especificar esto en
> la fórmula. Yo creo que es así:
>
> lme(x~sitio, random = ~ 1|id/visita, data = datos)
>
> Porque entiendo que hay que decir id/visita para que R entienda que a lo
> largo de las visitas los id son el mismo punto de medida.
> Pero no estoy seguro de si debe ser al revés ~1|visita/id
>
> ¿Que opinais?¿Voy por buen camino?
>
> Muchas gracias.
>
> --
> Jaume Tormo.
> https://flipboard.com/@jaumetormo/hallazgos-interesantes-bj8opmboy
> https://acercad.wordpress.com/
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ordenar data frame por variables

2021-11-04 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si vas a querer usar dplyr, que es lo que parece, puedes encontrar algunos
ejemplos muy parecidos al tuyo aquí
<https://www.statology.org/r-quantile-by-group/>. En concreto, aunque has
agrupado correctamente, te ha faltado decir qué es lo que quieres hacer con
esos grupos (la parte del summary).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El jue, 4 nov 2021 a las 18:01, Maximiliano Asencio ()
escribió:

> Hola, cómo están.
> Resulta que tengo una base de datos con los promedios de notas de distintos
> alumnos en distintos colegios, para distintos cursos, y necesito agrupar
> los alumnos por colegio y curso, para luego calcular sus notas según
> percentil (siendo el promedio más alto el percentil 1), pero no tengo idea
> de cómo hacerlo!
> Probé la función group_by:
>
> Df = Df %<% group_by(RBD, Curso)
>
> (Rbd es el código por colegio)
> Pero no hizo nada con el data frame. Tampoco puedo hacerlo con ifelse(), ya
> que son miles de colegios. La idea es que los datos queden agrupados, cada
> estudiante con sus notas según colegio y curso. Alguien tiene una idea de
> cómo hacerlo??
>
> Un abrazo,
> Max
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] glm.fit: fitted probabilities numerically 0 or 1 occurred

2021-07-21 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Casi seguro, tienes un (bendito) problema de separación perfecta. Casi
seguro, además, el error aparece cuando penalizas poco en glmnet.

De hecho, penalizar lo suficiente es la solución de libro para este
problema: evitas que el/los coeficiente/s culpable/s se vaya a infinito
porque penalizas su tamaño.

Si pintas la evolución de los coeficientes del modelo en función del grado
de penalización, casi seguro verás que con penalizaciones bajas tienes
coeficientes muy, muy altos, que son los que generan el "warning".

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El mié, 21 jul 2021 a las 22:08, patricio fuenmayor (<
patricio.fuenma...@gmail.com>) escribió:

> Hola a todos
> Estoy realizando un regresión logística y obtengo esta alerta:
> glm.fit: fitted probabilities numerically 0 or 1 occurred
> Pregunto cual es el proceso recomendado a seguir para evitar esto?
> Estoy usando glmnet y voy avanzando. Es la primera vez que tengo algo así.
>
> Saludos
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Dividir una variable

2021-07-19 Por tema Carlos J. Gil Bellosta

¿Algo así?

tmp <- do.call(rbind, strsplit(X, "-"))
Y1  <- as.numeric(tmp[,1])
Y2  <- as.numeric(tmp[,2])

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El lun, 19 jul 2021 a las 19:16, Jose Miguel Contreras ()
escribió:

> Hola a todos
>
> Estoy un poco atascado con cómo dividir una variable que tiene un carácter
> común en dos tomando la parte anterior del carácter y la posterior.
>
> La idea es,
>
> Dado un vector
> X <- c(“1-5”, “2-7”, “10-15”)
> La idea es sacar dos vectores
>
> Y1 <- c(1, 2, 10)
> Y2 <- c(5, 7, 15)
>
> Gracias
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] (sin asunto)

2021-05-10 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Tienes que bajar la tabla de

http://www.infocif.es/ranking/ventas-empresas/espana?pagina=1,
http://www.infocif.es/ranking/ventas-empresas/espana?pagina=
<http://www.infocif.es/ranking/ventas-empresas/espana?pagina=1>2,
etc.

Lo puedes hacer en un bucle.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El lun, 10 may 2021 a las 10:42, Javi Lopez ()
escribió:

> Hola. Acabo de suscribirme a la lista y espero poder colaborar aunque soy
> nuevo en R y estoy aprendiendo.
>
> Estoy intentando hacer un raspado de páginas web (web scraping),pero con mi
> código solo consigo que me devuelva la primera tabla, y necesitaría al
> menos una decena.
>
> url <- http://www.infocif.es/ranking/ventas-empresas/espana
> pagina <- read_html(url, as.data.frame=T, stringsAsFactors = TRUE)
> pagina %>%
> html_nodes("table") %>%
> .[[1]] %>%
> html_table(fill=T) -> x
>
> Así, como digo, consigo los datos de la primera tabla, pero no de las
> siguientes.
>
> Gracias por cualquier ayuda y por aceptarme en esta comunidad. Saludos
>
> Javier
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] HELP!! Expansión de variables en una base de datos con ID duplicados

2021-02-28 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

En seudocódigo:

   - Aplicas rank sobre -NRO_VISITA por ID (usando group_by + mutate).
   - Te quedas con el rank == 1.

Un saludo,

Carlos J. Gil Bellosta
http://www

El dom, 28 feb 2021 a las 15:38, kendy Boisrond ()
escribió:

> Hola Comunidad,
>
> Por favor necesito su ayuda:
>
> Se trata de una base, donde cada "ID" representa una vivienda única, pero
> por lo que puede haber más visitas en una misma vivienda, los "ID" están
> duplicados.
> La base visitas es de dimensión: 98692 x 52 (ID duplicados)
> y la base vivienda tendría una dimensión 29866 x 52 (ID únicos).
>
> A partir de la base "visitas", necesito sacar todos los "ID" únicos de la
> última visita en cada vivienda, y pude hacerlo con ese comando:
>
> Base1<- subset(Base_Visitas %>% group_by(enc_idr) %>% summarise(NRO_VISITA
> = max(NRO_VISITA)))
> dim(Base1)
>
> [1] 29866 2
>
> Sin embargo, necesito que me lo expande para todas las 52 variables para
> así realizar otro análisis... Llegué hasta aquí. ¿Me pueden ayudar a
> expandirla para todas las variables, por favor?
> Muchas gracias!!
>
>
>
> --
> *Kendy B.*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Exportar base se datos de r a excel

2021-02-15 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si dices que son códigos del tipo "002" y que R los trata como números,
entonces es que no los lee bien. Tendrás que forzar a R a leer "002" no
como el número 2 sino como lo que dice en la fuente, es decir, "002" como
caracter. Dependiendo de qué función de lectura uses para importar los
datos, tendrás que usar una opción u otra para hacerlo. Lee la
documentación de la que estés usando.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El mar, 16 feb 2021 a las 1:03, Ramiro Guzman ()
escribió:

> Buenas tardes, tengo una base de datos en r que limpié para exportarla a
> excel, sin embargo, tengo variables que son de carácter "character" pero
> son números como por ejemplo: "002", por lo que r la lee bien, sin embargo
> al exportarla a excel en formato csv, excel le quita los ceros y la deja
> como "2" y es que es vital que permanezca como "002", es decir que necesito
> que excel la lea como caracter. Por otra parte, no puedo probar con guardar
> mi base como xlsx, ya que al intentarlo me sale la siguiente leyenda:
> "error in .jnew("org/apache/poi/xssf/usermodel/XSSFWorkbook"):
> java.lang.OutOfMemoryError:GC overhead limit exceeded"
>
> Si alguien me pudiera apoyar en solucionar mi problemática de favor
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Error al cargar el paquete tidyr

2021-01-23 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

¿Y si pruebas a actualizar R y todos los paquetes? ¿Sigue fallando entonces?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El sáb, 23 ene 2021 a las 14:46, Manuel Mendoza ()
escribió:

> Lo había utilizado hasta ahora sin problemas.
>
> Error: package or namespace load failed for ‘tidyr’ in loadNamespace(i,
> c(lib.loc, .libPaths()), versionCheck = vI[[i]]):
>  namespace ‘vctrs’ 0.2.4 is already loaded, but >= 0.3.0 is required.
>
> Gracias,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Modelo potencial

2020-09-24 Por tema Carlos J. Gil Bellosta

Y dependiendo cómo creas que es el error (aditivo o multiplicativo), puedes
hacer

lm(log(Y) ~ log(t), data = dat)

No es exactamente el mismo modelo: depende, insisto, de si el error es
aditivo (sería raro) o mutliplicativo (más natural en ese tipo de modelos).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El jue., 24 sept. 2020 a las 20:23, Emilio L. Cano ()
escribió:

> Hola,
>
> Yo lo hago así:
>
> nls(Y ~ 4*D*t^a, data = tmsd,
>  start = list(D = Dl, a = al))
>
> D1 y a1 son valores iniciales que se parezcan a lo que esperas que valgan
>
> Un saludo,
> Emilio
>
>
> > El 24 sept 2020, a las 18:58, Jimmy Erney Reyes Velasco <
> jimmyreyesvela...@gmail.com> escribió:
> >
> > Buen día
> > ¿alguien sabe como puedo hacer un modelo de la forma y=ax ^b con el
> > metodo minimos cuadrados no lineales nls?
> > agradezco mucho la información
> >
> >   [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Interpretación de salida de un GLM

2020-09-14 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Es largo contestar a todo lo que planteas, pero déjame darte una
recomendación acerca de una de las cuestiones que planteas: la
estandarización de la variable HF. No usaría ni los datos crudos ni
estandarización vía media-sd. En lugar de eso, colocaría el 0 en un nivel
"normal" o "de referencia" (¿existe tal cosa?) para esa variable y tal vez
la escalaría para que incrementos de una unidad (escalada) se
correspondiesen con incrementos razonables de la variable subyacente (¿cien
unidades de la otra?).

Así podrías interpretar la salida del modelo en términos del incremento de
la probabilidad de la variable objetivo (sea o no a través de los infames
*odds*) frente a variaciones de tamaño "normal" frente a niveles "normales"
de las variables más relevantes. Además, el término independiente también
tendría una interpretación razonable.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El lun., 14 sept. 2020 a las 21:45, Juan Seco Lopez (<
juansecolo...@gmail.com>) escribió:

> Estimada comunidad, tengo unas dudas que son muy básicas creo, pero es mi
> primera incursión en GLM.
> Estoy ajustando un modelo binomial a unos datos de germinación. El modelo
> es muy sencillo, tengo un factor "Condicion" con dos niveles: "a" y "b"
> (nivel de humedad en suelo). Por otro lado, tengo una variable explicativa
> "HF" (horas frío=estratificación) que va de 0 a 2160 (en el modelo esta
> variable es HFe por estandarizada y centrada).
> Acá van mis preguntas:
>  - ¿cómo interpreto la salida? Si, por ejemplo, me
> encuentro bajo la "condicion a", ¿no incluyo los
> términos +1.97820*Condicionb y +1.22376*Condicionb*HFe?
>  - cuando tengo que reemplazar los valores HFe en la
> fórmula, ¿tengo que utilizar los valores centrados y estandarizados o
> puedo usar los valores "crudos" HF?  Pregunto esto porque perdería
> reproducibilidad del modelo si utilizo los datos centrados
>
> Les dejo el summary de mi modelo y agradezco de antemano su colaboración.
> Saludos
>
>
> Call:
> glm(formula = prop ~ Condicion + HFe + Condicion * HFe, family = binomial,
> data = datos)
>
> Deviance Residuals:
> Min   1Q   Median   3Q  Max
> -4.0365  -1.2027   0.0994   0.9577   3.4023
>
> Coefficients:
>   Estimate Std. Errorz value
>  Pr(>|z|)
> (Intercept)  -1.177490.04484  -26.262   < 2e-16
> ***
> Condicionb 1.97820 0.06434  30.745< 2e-16
> ***
> HFe-0.206260.04503  -4.581
>  4.64e-06 ***
> Condicionb:HFe 1.22376 0.06667  18.355< 2e-16 ***
> ---
> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> (Dispersion parameter for binomial family taken to be 1)
>
> Null deviance: 1923.94  on 139  degrees of freedom
> Residual deviance:  348.59  on 136  degrees of freedom
> AIC: 875.09
>
> Number of Fisher Scoring iterations: 4
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] SALDO EN RESUMEN DE CUENTA CONTABLE

2020-09-10 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Lo que quieres es algo así como

cumsum(debe) - cumsum(haber)

o una variante de lo anterior.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalyltics.com

El jue., 10 sept. 2020 a las 11:50, Jesus MARTIN F. ()
escribió:

> Tengo que preparar un Dataset que termine siendo un resumen de cuenta
> contable a partir de los datos del diario contable de una empresa que el
> script va filtrando cuenta por cuenta. He podido importar los datos con
> variables: fecha , concepto, valor debe, valor haber y me falta una
> variable que sea el saldo. Sucede que el saldo se tiene que calcular fila a
> fila, es decir sumando el valor debe y restando el valor haber al saldo de
> la fila anterior y no he logrado hacerlo. Podrían ayudarme ?
>
>Gracias
>
>Jesús
> --
> Jesus Martin Frade
> Papelera ANDORPEL
> (+54) (9) 11 4946 2131
> jesusmar...@andorpel.com
> jesusmar...@andorra.ad
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Procedimiento car0

2020-05-10 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Es especulativo, pero tener rutas en el disco duro que incluyen espacios
(como el que hay entre Manuel y Mendoza) es buscarse problemas. Si el
fichero raster.dll está donde se indica en la imagen, es probable que el
problema sea debido a eso.

Que se pueda (usar espacios en rutas) no significa que se deba.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El dom., 10 may. 2020 a las 0:55, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Alguien sabe lo que significa?
>
> [image: image.png]
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Cannot allocate a vector of size...

2020-02-07 Por tema Carlos J. Gil Bellosta

La primera matriz es sparse y la segunda no. Tal vez puedas continuar
dentro del universo de tm eliminando términos irrelevantes antes de
construir una matriz no completa. O tal vez puedas construir una matriz
sparse directamente.

El vie., 7 feb. 2020 17:26,  escribió:

> Buenas tardes,
>
> Estoy haciendo un análisis de contenido con el paquete tm. A la hora de
> ejecutar este código:
>  tdm<-TermDocumentMatrix(corpus,control=list(weighting =weightTf))
>  tdm.reviews.m<-as.matrix(tdm)
>
> La primera línea sí me la ejecuta bien pero en la segunda tengo este error:
> Error: cannot allocate vector of size 14.0 Gb
>
> ¿Cómo puedo corregirlo? Estoy usando la versión de 64bits de R.
>
> Un saludo
>
> Miriam
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] titanic

2020-01-02 Por tema Carlos J. Gil Bellosta

?write.csv

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El jue., 2 ene. 2020 a las 13:41, Jose Betancourt B. ()
escribió:

> Estimados
> quisiera poder salvar a csv y  a excell la base de datos titanic
>
> data("titanic", package = "prLogistic")
>
> saludos
> José
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Modelo Poisson con endogeneidad

2019-11-26 Por tema Carlos J. Gil Bellosta

¿Tienes nulos en los datos originales? La función lm, por defecto, usa
na.action = na.omit...

Lo que quieras hacer con los nulos, de tenerlos, es otra historia...

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El mar., 26 nov. 2019 a las 17:23,  escribió:

> Buenas tardes,
>
> Tengo una pregunta sobre un error que me da R. Estoy usando un modelo
> Poisson con función de control para corregir la endogeneidad (de
> instrumentos) y tengo que calcular primero los residuos de una regresión
> lineal para posteriormente introducirlos en la segunda etapa.
>
> Cuando los calculo y los meto en la siguente etapa me da este error:
> Error in `$<-.data.frame`(`*tmp*`, d.hat.residualsconExogmosthelp, value =
> c(0.109134748058386,  :
>   replacement has 54535 rows, data has 59526)
>
> Observo que mi base de datos tiene 59526 observaciones pero el vector de
> residuos tiene 54535.
>
> ¿A qué se puede deber el hecho de que haya menos observaciones en los
> residuos que en la variable real?
>
> Muchas gracias,
>
> Miriam
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Interpolación lineal por grupos

2019-11-25 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Es que no interpolas (únicamente) sino que extrapolas (también): de ahí que
puedas obtener valores negativos.

Por otra parte, ¿estás seguro de que los datos dentro de cada país están
ordenados?

Finalmente, si quieres forzar valores positivos, tienes opciones más o
menos justificables y/o peligrosas como exponenciar la extrapolación del
logaritmo de tus datos. Aunque también puedes reemplazar exp (log) por otra
función positiva (y su correspondiente inversa).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El lun., 25 nov. 2019 a las 20:30, Antonio Rodriguez Andres (<
antoniorodriguezandre...@gmail.com>) escribió:

> Hola a todos
>
> Tengo datos por paises y en el tiempo sobre costes de exportacion.
> Aparentemente hace bien el codigo la interpolacion, pero en algunos casos
> me da valores negativos
> coste.imputado
> 2630
> *2199*
> *1768*
> *1337*
> *906*
> *-347*
> *177*
>
> El codigo es este
> df_imputed <- datos %>%
>   group_by(country) %>%
>   mutate(costexportimputado =
>approxExtrap(which(!is.na(costexport)),costexport[!is.na
> (costexport)],xout
> = 1:n(), rule =1)$y)
>
> Alguna idea de que puede fallar
>
> saludos
> --
>
> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
> SAGE journal)
>
> http://elr.sagepub.com/
>
> Member, Editorial Committee, African Journal of Economic and Management
> Studies
>
>
> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>
> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
> profile)
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Consulta

2019-09-24 Por tema Carlos J. Gil Bellosta

Parece que la variable `nombre` no está [bien] definida. De ahí el primer
error:

Error in normalizePath(path.expand(path), winslash, mustWork) :
  path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\.pdf": El
sistema no puede encontrar el archivo especificado

En cuanto al segundo,

Error in normalizePath(path.expand(path), winslash, mustWork) :

path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\caratula_340007195-01-C_6158_22_07_2019_162916.
*pdf.pdf*": El sistema no puede encontrar el archivo especificad

fíjate en lo que he marcado en negritas.

El mar., 24 sept. 2019 a las 16:50, BERENICE DOMINGUEZ SANCHEZ (<
ds_b...@hotmail.com>) escribió:

> Emilio
>
> Buen día, si me manda un error muy especifico que no reconoce una función
> de pdftools
>
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))
> Error in normalizePath(path.expand(path), winslash, mustWork) : 
>   path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\.pdf": El
> sistema no puede encontrar el archivo especificado
> > prueba <-image_ocr(imagen, language = 'eng')
> Error in assert_image(image) : object 'imagen' not found
> > lineas<-unlist(str_split(prueba,pattern = "\n"))
> Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : 
>   object 'prueba' not found
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))
> Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : 
>   object 'prueba' not found
>
>   Error in normalizePath(path.expand(path), winslash, mustWork) :
>
> path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\caratula_340007195-01-C_6158_22_07_2019_162916.pdf.pdf":
> El sistema no puede encontrar el archivo especificad
>
>
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
>
> Hice dos cosas:
>
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
>
> Saludos.
>
> 
> De: Emilio L. Cano 
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Lista R 
> Asunto: Re: [R-es] Consulta
>
> Hola Berenice,
>
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
>
> Para poder reproducir el error con tu código haría falta alguno de los
> pdfs que utilizas (puedes compartir un enlace a dropbox o similar).
>
> Un saludo,
> Emilio
>
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
> >
> > Buenas tarde a todo@s:
> >
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para
> extraer información de archivos en pdf actualice la versión 3.6.1 y ya no
> reconoce la paquetería alguien que me pueda ayudar. Prácticamente no
> reconoce las funciones de pdftools
> >
> > library(pdftools)
> > library(stringr)
> > library(NLP)
> > library(tm)
> > library(tesseract)
> > library(magick)
> > install.packages("magick")
> > install.packages("pdftools")
> > 
> > txt <- system.file("texts", "txt", package = "tm")
> > 
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"
> > #poliza_rg <-
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"
> > poliza_rg <-
> "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"
> > registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"
> > subgrupo_rg <- "_([0-9]){1,3}."
> > mon_rg <- "SMGM|UMAM|MN"
> > 
> > 
> > ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'
> > archivos<-list.files(path=ruta,pattern = '*.pdf')
> > 
> > 
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))
> > prueba <-image_ocr(imagen, language = 'eng')
> > lineas<-unlist(str_split(prueba,pattern = "\n"))
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))
> > 
> > newnom <- NULL
> > renglones <- NULL
> > for (nombre in archivos){
> >  subgrupo <- str_extract(str_extract(nombre,pattern =
> subgrupo_rg),pattern = "[0-9]{1,3}")
> >  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))
> >  prueba <-image_ocr(imagen, language = 'eng')
> >  lineas<-unlist(str_split(prueba,pattern = "\n"))
> >  poliza <- NULL
> >  poliza<-str_extract(lineas[1],poliza_rg)
> >  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))
> >  
> >  registro <- NULL
> >  registro<-str_extract(lineas[49],registro_rg)
> >  
> >  rfc <- NULL
> >  rfc <- str_extract(lineas[5],rfc_rg)
> >  
> >  
> >  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))
> >  #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))
> >  
> >  cobertura <- NA
> >  extranjera <- NA
> >  suma_str   <- NA
> >  deducible_str <- NA
> >  
> >  suma <- NA
> >  coaseguro <- NA
> >  deducible <- NA
> >  tope <- NA
> >  mon <- NA
> >  mondedu <- NA
> >  
> >  cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)
> >  extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)
>

Re: [R-es] Identificar todos los repetidos y "marcarlos".

2019-05-18 Por tema Carlos J. Gil Bellosta

Afortunadamente, en R no hay una función para cada cosa que a uno se le
ocurra hacer. El diccionario de funciones sería infinito.

Lo que quieres hacer es una línea de código:

library(plyr)
tmp <- iris

res <- ddply(tmp, .(Species), transform, reps = count(Species))

En "reps" tienes el número de veces que se repite cada "id" y puedes hacer
lo que quieras con esas filas donde reps > 1.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El sáb., 18 may. 2019 a las 19:07, Samura . ()
escribió:

> Hola,
> gracias por la respuesta.
>
> Por como funciona "duplicate" el dato original que se repite no lo marca,
> y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame
> con todos dnis  repetidos y ver en que se diferencian observando el resto
> de variables.
>
> Al final lo he resuelto de una manera un poco artesanal, obteniendo los
> dnis unicos de los duplicados y filtrando
> pero pensaba que habria alguna funcion que te diera todos los repetidos de
> golpe.
>
> Un saludo.
>
> 
> De: Salvador Castillo Raya 
> Enviado: sábado, 18 de mayo de 2019 0:31
> Para: Samura .; r-help-es@r-project.org
> Asunto: RE: Identificar todos los repetidos y "marcarlos".
>
>
> Hola,
>
>
>
> Te serviría algo así:
>
>
>
> df <- data.frame(x=c(1, 1, 4, 5, 4, 6))
>
>
>
> df <- cbind(df, ind_duplicado = as.integer(duplicated(df)))
>
>
>
> df_sindup <-subset(df, ind_duplicado == 0)
>
>
>
> Saludos.
>
>
>
> 
> From: R-help-es  on behalf of Samura . <
> tontit...@hotmail.com>
> Sent: Saturday, May 18, 2019 2:10:37 AM
> To: r-help-es@r-project.org
> Subject: [R-es] Identificar todos los repetidos y "marcarlos".
>
> Hola,
> Tengo la siguiente duda:
> �existe algo parecido a identificar casos repetidos en R al estilo de como
> lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos)
>
> Estoy probando con "duplicated" pero no es lo que busco.
>
>
> Gracias.
>
> [[alternative HTML version deleted]]
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Como asignar valores de un archivo a otro

2019-03-20 Por tema Carlos J. Gil Bellosta

?merge

El mié., 20 mar. 2019 a las 14:22, MAURICIO MARDONES (<
mauricio.mardo...@ifop.cl>) escribió:

> Amigos erreros
>
> Pocas veces consulto, por que siento que soy muy básico, pero esta vez
> quise socializar a pesar de ello.
>
> Tengo 2 archivos .csv pero quiero asignar valores de una columna a las
> mismas variables que se encuentran en el otro archivo.
>
> así;
>
> head(archivo_csv1)
>  Long  Año Proced
> 1   47 2016   9003
> 2   48 2016   9003
> 3   49 2016   9003
> 4   49 2016   9003
> 5   50 2016   9003
> 6   50 2016   9003
>
> head(archivo_csv2)
>
> Proced  LATITUD LONGITUD
> 1   9841 -52.4342 -74.5177
> 2   9841 -52.4342 -74.5177
> 3   8940 -50.7500 -74.5000
> 4   9003 -52.4342 -74.5177
> 5   9833 -49.8016 -75.1837
> 6   9840 -49.9686 -75.2171
>
> Mi idea es asignar las columnas de LATITUD y LONGITUD del archivo_csv2 a
> las procedencias que tengas esa condición en el archivo_csv1.
>
> Espero se entienda
>
> Estoy en un bucle mental. Cualquier reseña me podría alumbrar el camino
>
> Saludos
> --
>
> *Mauricio Mardones Inostroza*
>
> Investigador Departamento Evaluación de Recursos
> Instituto de Fomento Pesquero - IFOP
> Valparaíso - Chile
> +56-32-21514 42
>
> www.ifop.cl
>
> --
> C*ertificación ISO 9001/2008*: Sistema de Datos
> Biológico-Pesqueros (Arica,
> Iquique, Coquimbo, Valparaíso, San Antonio, Talcahuano y Calbuco,
> pesquerías industriales y artesanales)
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-06 Por tema Carlos J. Gil Bellosta

Con R base:

paises <- factor(c("a", "b", "c", "c", "a"))

zonas <- c("norte", "norte", "sur")
names(zonas) <- c("a", "b", "c")

zonas_paises <- paises
levels(zonas_paises) <- zonas[levels(zonas_paises)]
zonas_paises

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El mié., 6 mar. 2019 a las 15:41, Xavier-Andoni Tibau Alberdi (<
xaviti...@gmail.com>) escribió:

> No, No. Fíjate en el Ifelse(condición, valor si positivo, valor si
> negativo).
>
> Si, x %in% ca entonces el valor devuelto es "ca", un factor. En caso
> negativo, vamos al siguiente bloque iflese, que comprueba si el país esta
> en el siguiente grupo, na. Si está en na nos devuelve "na". Vamos, que la
> función mira en que grupo esta ese país y te devuelve una string,
> correspondiente al país. Así que ahora tienes un factor, con 5 posibles
> valores ("ca", "na", ..., "ea"). Es lo que quieres no?
>
> Xavier Tibau
>
> Missatge de Antonio Rodriguez Andres 
> del dia dc., 6 de març 2019 a les 15:34:
>
> > Pero eso es para crear variables binarias tipo 0-1 si el pais pertence a
> > un determinado grupo. Lo que quiero es crear una variable de tipo factor
> > con esos 5 niveles, sabiendo que tengo en el dataframe una variable
> llamada
> > Country, con el nombre del pais.
> > Gracias
> >
> > On Wed, 6 Mar 2019 at 15:27, Xavier-Andoni Tibau Alberdi <
> > xaviti...@gmail.com> wrote:
> >
> >> Buenas,
> >>
> >> Para ello yo uso el operador %in%, que me dice si algo esta dentro de un
> >> vector. Luego hago bucles de if else, pero usando la función iflese().
> Si
> >> país X esta en países lista ca, entonces "ca",etc. Puedes crear una
> función
> >> que englobe ese iflese(), para aplicarla para cada columna del
> dataframe.
> >>
> >> Algo así como:
> >>
> >> func1 <- func (x) {ifelse(x %in% ca, "ca", ifelse(x %in% na,"na", ...,
> >> ifelse(x %in% ea, "ea", "otros"))...)}
> >>
> >> espero que te sirva!
> >>
> >> Xavier Tibau
> >>
> >>
> >>
> >> Missatge de Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>
> >> del dia dc., 6 de març 2019 a les 15:10:
> >>
> >>> Hola estimados miembros de la comunidad de R
> >>>
> >>> Tengo un conjunto de datos, donde tengo observaciones por países y por
> >>> año.
> >>> Una de las variables del dataframe es el nombre del país. Queremos
> >>> dividir
> >>> los países, que son países africanos de acuerdo a 5 regiones: norte de
> >>> africa, africa del este, sur africa, etc
> >>>
> >>> Yo lo que he hecho ha sido crear vectores con el nombre de cada uno de
> >>> los
> >>> países en cada uno de ellos, por ejemplo este de Africa Central,
> >>>
> >>> ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African Republic",
> >>> "Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
> >>> "Gabon", "Sao Tome and Principe")
> >>> class(ca)
> >>> character
> >>>
> >>> luego hice un ifelse para crear una variable binaria 1 si es pais de
> >>> Central Africa y cero sino lo es
> >>>
> >>> afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)
> >>>
> >>> Sin embargo, para el análisis podría ser más interesante crear una
> >>> variable
> >>> nueva por ejemplo region y tratarla como factor,. Mi pregunta es como
> >>> podria pasar esos 5 vectores con el nombre de los paises de cada
> region a
> >>> una sola variable tratada como un factor y con esos 5 niveles ( 5
> >>> regiones). Lo que he tratado es de hacer esto para genera una nueva
> >>> variable en el dataframe, pero me da que todo es igual false, en el
> >>> valor,
> >>>
> >>> afdata$region <- with(afdata,{
> >>>   (Country == "ca" |Country == "na" | Country == "sa" | Country ==
> "wa" |
> >>> Country == "ea")
> >>> })
> >>> Debo de indicar otra condición?
> >>>
> >>> Agradezco alguna pista
> >>>
> >>> --
> >>>
> >>>

Re: [R-es] Error "valor ausente TRUE/FALSE..." en doble loop FOR

2019-01-25 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si phen_tot es un DF, entonces no existe phen_tot$convergence[i][j]. A lo
más, existe phen_tot$convergence[i], que es el i-ésimo elemento de la
columna "convergence" de phen_tot. A saber cuál es la lógica que quieres
implementar ahí.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El vie., 25 ene. 2019 a las 15:24, Xavier-Andoni Tibau Alberdi (<
xaviti...@gmail.com>) escribió:

> Buenas,
>
> puedes imprimir phen_tot$convergence[i][j], con diversas i i j, para ver
> que te devuelve. también puedes usar type(phen_tot$convergence[i][j]) para
> ver que tipo es. Entonces sabrás que tienes que poner en el oro lado del
> if.
>
> Un saludo!
>
> Xavier Tibau
>
> Missatge de Gemma Ruiz-Olalla  del dia dv.,
> 25 de gen. 2019 a les 15:06:
>
>> Hola Carlos,
>>
>> Gracias por la respuesta. phen_tot es un data frame visualizado como
>> tibble, y contiene (entre otras) las columnas "convergence", "r_square" y
>> "maxlog10mfi". Y queremos crear nuevas columnas, como "use",
>> "convergence_cor", etc.
>>
>> phen_tot$convergence debería ser un factor de si el modelo converge o no
>> (levels: 1 y 2), pero tibble lo tiene como "double". Pensamos que de ahí
>> podía venir el error e intentamos cambiarlo a factor con "factor()" y con
>> "as.factor()", pero nada funcionó. Creemos que no funcionó porque todos
>> los
>> valores que tenemos son 1, y no tenemos ningún 2, así que no lo detecta
>> como nivel del factor. ¿Puede ser?
>>
>> Muchas gracias,
>>
>> Gemma
>>
>>
>> El vie., 25 ene. 2019 a las 14:07, Carlos J. Gil Bellosta (<
>> gilbello...@gmail.com>) escribió:
>>
>> > Hola, qué tal? Habría que ver qué contiene el objeto phen_tot, pero la
>> > expresión
>> > phen_tot$convergence[i][j]
>> > es muy sospechosa. Qué estructura tiene phen_tot$convergence?
>> >
>> > Un saludo,
>> >
>> > Carlos J. Gil Bellosta
>> >
>> >
>> > El vie., 25 ene. 2019 13:32, Gemma Ruiz-Olalla <
>> gemma.ruizola...@gmail.com>
>> > escribió:
>> >
>> >> Buenas tardes,
>> >>
>> >> Estamos intentando hacer esta función, y sabemos que el bucle funciona
>> (lo
>> >> hemos testeado). Pero nos da este error ya en la primera línea:
>> >>
>> >> "Error in if (phen_tot$convergence[i][j] == '2' ||
>> phen_tot$r_square[i][j]
>> >> <= : valor ausente donde TRUE/FALSE es necesario"
>> >>
>> >> Hemos evitado usar Tidyverse expresamente por la complejidad de la
>> toma de
>> >> decisiones del árbol; por eso queremos mantener los bucles "for".
>> >>
>> >> ¿Alguien nos puede echar una mano para ver qué falla?
>> >>
>> >>
>> >> for(i in l_plates) {
>> >>   for(j in l_analytes) {
>> >>
>> >>   # arguments
>> >>   if(phen_tot$convergence[i][j] == '2' || phen_tot$r_square[i][j]
>> <=
>> >> 0.9) {
>> >>
>> >> # first condition
>> >> phen_tot$convergence_cor <- 'F'
>> >> phen_tot$use <- 'F'
>> >> phen_tot$ref_val <- 15000
>> >>
>> >> # second condition
>> >> }else {phen_tot$convergence_cor[i][j] <- 'T'
>> >> if(phen_tot$max_log10mfi[i][j] < log10(15000)){
>> >>     phen_tot$use[i][j] <- 'F'
>> >> phen_tot$ref_val[i][j] <- 15000
>> >>
>> >> # third condition
>> >> }else {phen_tot$use[i][j] <- 'T'
>> >> phen_tot$ref_val[i][j] <- phen_tot$pred_log10mfi[i][j]
>> >> }
>> >> }
>> >>  }
>> >>   }
>> >>
>> >>
>> >> Muchas gracias,
>> >>
>> >> --
>> >> Gemma
>> >>
>> >> [[alternative HTML version deleted]]
>> >>
>> >> ___
>> >> R-help-es mailing list
>> >> R-help-es@r-project.org
>> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> >>
>> >
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>

-- 
Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Error "valor ausente TRUE/FALSE..." en doble loop FOR

2019-01-25 Por tema Carlos J. Gil Bellosta

Hola, qué tal? Habría que ver qué contiene el objeto phen_tot, pero la
expresión
phen_tot$convergence[i][j]
es muy sospechosa. Qué estructura tiene phen_tot$convergence?

Un saludo,

Carlos J. Gil Bellosta


El vie., 25 ene. 2019 13:32, Gemma Ruiz-Olalla 
escribió:

> Buenas tardes,
>
> Estamos intentando hacer esta función, y sabemos que el bucle funciona (lo
> hemos testeado). Pero nos da este error ya en la primera línea:
>
> "Error in if (phen_tot$convergence[i][j] == '2' || phen_tot$r_square[i][j]
> <= : valor ausente donde TRUE/FALSE es necesario"
>
> Hemos evitado usar Tidyverse expresamente por la complejidad de la toma de
> decisiones del árbol; por eso queremos mantener los bucles "for".
>
> ¿Alguien nos puede echar una mano para ver qué falla?
>
>
> for(i in l_plates) {
>   for(j in l_analytes) {
>
>   # arguments
>   if(phen_tot$convergence[i][j] == '2' || phen_tot$r_square[i][j] <=
> 0.9) {
>
> # first condition
> phen_tot$convergence_cor <- 'F'
> phen_tot$use <- 'F'
> phen_tot$ref_val <- 15000
>
> # second condition
> }else {phen_tot$convergence_cor[i][j] <- 'T'
> if(phen_tot$max_log10mfi[i][j] < log10(15000)){
> phen_tot$use[i][j] <- 'F'
> phen_tot$ref_val[i][j] <- 15000
>
> # third condition
> }else {phen_tot$use[i][j] <- 'T'
> phen_tot$ref_val[i][j] <- phen_tot$pred_log10mfi[i][j]
> }
> }
>  }
>   }
>
>
> Muchas gracias,
>
> --
> Gemma
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Clases S3, S4...

2018-12-09 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

S3 es un sistema de clases bastante primitivo. Está pensado esencialmente
para poder usar la misma función (p.e., plot) con diversos tipos de
objetos. Funciona esencialmente así:

1) Se define una función, p.e., plot, como genérica.
2) Los autores de paquetes, etc. crean objetos y les asignan una clase
(p.e., "lm").
3) Si esos autores quieren usar plot para su objeto, crean una función con
el nombre plot.lm (el nombre de la función genérica, seguido de punto y
seguido del nombre de la clase).
4) R, cuando ve plot(x), pregunta a x su clase (X) y le aplica la función
plot.X correspondiente (de existir).

Cuando los expertos en informática ven eso siempre preguntan: ¿en serio?
Porque es muy, muy cutre. Pero efectivo.

Las clases S4 implementan un mecanismo de orientación a objetos más similar
a los de otros lenguajes con OO: Python, Java y otros.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El dom., 9 dic. 2018 a las 14:26, Jesús Para Fernández (<
j.para.fernan...@hotmail.com>) escribió:

> Buenas
>
> Desde hace ya bastante tiempo veo viendo que hay diferentes tipos de
> clases en R, las mas viejas, S3, y luego algunas mas modernas como S4,...
> ¿Que diferencias existen entre estas clases? Alguna buena referencia la
> respecto, que sea entendible por un profano de la informatica?=
>
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] suma del resultado de multiplicar fila x columna

2018-06-28 Por tema Carlos J. Gil Bellosta

Eso que cuentas se llama multiplicación matricial. Usa %*%.

El jue., 28 jun. 2018 14:37, Manuel Mendoza 
escribió:

>
> Buenas tardes, tengo 2 dfs: Dieta de (108x11) y Abund de (591x108).
> Necesito multiplicar cada columna de la 1ª (108
> 
> elementos) por cada
> fila de la 2ª (108 elementos) y crear una nueva df con las sumas de
> esas multiplicaciones. He hecho esto, pero no sale y creo que está
> lejos de estar bien:
>
>
> Res <- matrix(nrow=nrow(Abund),ncol=ncol(Dieta))
> Res <- as.data.frame(Res)
>
> for(i in 1:nrow(Dieta)){
> for(j in 1:ncol(Abund)){
>   a<-as.vector(Dieta[,i])
>   b<-as.vector(Abund[j,])
>   sum <- sum(a * b)
>   Res[i,j]<-sum
>  }
>print(i)
>}
>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] loop con matriz que cambia de nombre

2018-06-22 Por tema Carlos J. Gil Bellosta

Es que no quieres crear objetos con nombres raros en tu entorno. Lo que
quieres hacer es crear una lista de matrices (o dfs). El consejo anterior
te explicaba con detalle cómo dispararte en el pie. Realmente, quieres
hacer otra cosa.

El vie., 22 jun. 2018 a las 19:53, Manuel Mendoza ()
escribió:

>
> Funciona, me crea una matriz en cada iteración, con un nombre que
> incluye el nº de la iteración. Me surge ahora el problema de que,
> dentro del mismo bucle la quiero convertir en df y ponerle nombre a
> las columnas, y como el nombre de la matriz es distinto cada vez, no
> sé cómo hacerlo. Supongo que se hará todo al crearla, pero no sé cómo.
>
> Un problema adicional es que las variables (columnas) también han de
> llevar la "i" incluida en el nombre, porque al final se fusionan todas
> las dfs y no se puede repetir el nombre de las variables.
>
> Gracias una vez más.
>
>
>
>
> Quoting Jesús Para Fernández :
>
> > Con assing y un paste0
> >
> > Mete dentro del bucle esto
> >
> > for(i in 1:7){
> > assign(paste0('matriz',i),matrix(0,ncol=5,nrow=3))
> >
> > }
> >
> > Con eso generarias 7 matrices de 5x3, llamadas matriz1, matriz2,...
> >
> > Obtener Outlook para Android
> >
> > 
> > From: R-help-es  on behalf of
> > Manuel Mendoza 
> > Sent: Friday, June 22, 2018 10:15:55 AM
> > To: r-help-es@r-project.org
> > Subject: [R-es] loop con matriz que cambia de nombre
> >
> >
> > Buenos días. Quiero hacer un for (j), anidado en otro for (i). En el
> > 2º for, en cada iteración ha de crear una matriz vacía: mat <-
> > matrix(nrow=nrow(data),ncol=19) pero llamándola de forma distinta cada
> > vez. El nombre ha de ser: paste("D",i,colnames(Data[j]),sep=""). Llevo
> > un rato haciendo pruebas pero no me sale. A ver si alguien pudiera
> > ayudarme,
> > gracias,
> > Manuel
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > .
> > --
> > Dr Manuel Mendoza
> > Department of Biogeography and Global Change
> > National Museum of Natural History (MNCN)
> > Spanish Scientific Council (CSIC)
> > C/ Serrano 115bis, 28006 MADRID
> > Spain
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Encontrar el más votado

2018-04-14 Por tema Carlos J. Gil Bellosta

apply(data, 1,  function(x) which.max(table(x)))

El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza ()
escribió:

>
> Buenas tardes de sábado. LLevo más de una hora intentando una cosa que
> debe ser una chorrada; a ver si alguien puede ayudarme.
>
> Tengo una matriz (data) de 1000 muestras (filas) y 6 categorías
> posibles. Hay 100 columnas, es decir, 100 votos para cada muestra, y
> necesito crear un vector con la categoría más votada de las 6.
>
>   which.max(table(data[i,])) me da la más votada de la muestra i.
> Estoy intentando crear el vector con un for y de momento no me sale.
> ¡ya! es muy fácil, pero no me sale, y estoy seguro de que hay una
> forma mucho más fácil.
>
> Gracias,
> Manuel
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Warning en modelo ZINB

2018-04-10 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Pues casi seguro que tienes un caso de "separación perfecta".  Aunque no
exista una variable única (p.e., un nivel en una variable categórica) que
tenga asociados solo valores 0, es posible que exista una combinación
lineal de variables que separe regiones donde solo hay ceros del resto de
las observaciones.

Un modelo inflado contiene internamente algo muy parecido a una regresión
logística y te estás encontrando un problema muy parecido a este
<https://www.datanalytics.com/2010/10/25/una-solucion-al-problema-de-la-separacion-perfecta-con-regresiones-logisticas/>.
Existe código en R para solucionar ese problema en el contexto de la
logística (penalizaciones a lo Jeffrey, incluso ridge/lasso), pero no creo
que se hayan incorporado en modelos más específicos como los inflados.

No sé si tu paquete te permite introducir penalizaciones en parámetros (que
es la vía que señalaba más arriba). La otra opción es la ruta "fully
bayesian", como aquí
<https://github.com/stan-dev/example-models/tree/master/BPA/Ch.12>.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com




El lun., 9 abr. 2018 a las 20:35, <miriam.alz...@unavarra.es> escribió:

> Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
> sigue dando el aviso...
>
> El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió:
> > Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
> > plausible. Sobre todo cuando tienes más de un 90% de ceros.
> >
> > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs
> > binomial
> > negativa) sería infinito. Y de ahí el warning.
> >
> >
> >
> > El lun., 9 abr. 2018 a las 20:09, <miriam.alz...@unavarra.es> escribió:
> >
> >>
> >> ¿Quieres decir que para un nivel de una variable categorica todas las
> >> observaciones de la variable respuesta sean ceros?
> >>
> >> Gracias
> >> El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió:
> >> > ¿Podría ser que para algún nivel de alguna variable independiente
> >> > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería
> >> ese
> >> > tipo de warning.
> >> >
> >> > El lun., 9 abr. 2018 a las 19:00, <miriam.alz...@unavarra.es>
> >> escribió:
> >> >
> >> >> Muchas gracias por la respuesta. He mirado y los coeficientes no son
> >> >> altos
> >> >> pero sí tengo una gran cantidad de ceros en la variable dependiente
> >> (más
> >> >> del 90%). Sin embargo, al incluir otro tipo de variables
> >> independientes
> >> >> no
> >> >> me da ese aviso, dejando la misma variable dependiente.
> >> >>
> >> >> ¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar
> >> el
> >> >> modelo?
> >> >>
> >> >> Muchas gracias
> >> >>
> >> >> El Lun, 9 de Abril de 2018, 18:48, Carlos J. Gil Bellosta escribió:
> >> >> > Hola, ¿qué tal?
> >> >> >
> >> >> > El "warning" que comentas aparece en glm.fit precisamente cuando un
> >> >> > coeficiente diverge.
> >> >> >
> >> >> > El aviso puede ser malo o irrelevante, depende. Puede que haya sido
> >> >> > emitido
> >> >> > en algún paso intermedio del ajuste (por lo que no habría mayor
> >> >> problema).
> >> >> > O que afecte al ajuste entero. Uno de los síntomas de que el ajuste
> >> es
> >> >> > malo
> >> >> > es que algún coeficiente de tu modelo es excesivamente grande. O
> >> que
> >> >> el
> >> >> > peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es
> >> lo
> >> >> mismo
> >> >> > en el contexto de un modelo inflado). Mira a ver qué pinta tienen
> >> los
> >> >> > coeficientes y si tienen cierto sentido a la vista de tus datos.
> >> >> Vigila
> >> >> > los
> >> >> > extremadamente altos.
> >> >> >
> >> >> > Si no estás segura de tus coeficientes, puedes implementar el
> >> modelo
> >> >> > generativamente vía stan/rstan. Es sencillo y tendrías buenos
> >> >> diagnósticos
> >> >> > de lo que esta ocurriendo.
> >> >> >
> >> >> > Un saludo,
> >> >> >
> >> >> > Carlos

Re: [R-es] Warning en modelo ZINB

2018-04-09 Por tema Carlos J. Gil Bellosta

Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
plausible. Sobre todo cuando tienes más de un 90% de ceros.

El coeficiente de ese nivel para el modelo de la mixtura (ceros vs binomial
negativa) sería infinito. Y de ahí el warning.



El lun., 9 abr. 2018 a las 20:09, <miriam.alz...@unavarra.es> escribió:

>
> ¿Quieres decir que para un nivel de una variable categorica todas las
> observaciones de la variable respuesta sean ceros?
>
> Gracias
> El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió:
> > ¿Podría ser que para algún nivel de alguna variable independiente
> > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese
> > tipo de warning.
> >
> > El lun., 9 abr. 2018 a las 19:00, <miriam.alz...@unavarra.es> escribió:
> >
> >> Muchas gracias por la respuesta. He mirado y los coeficientes no son
> >> altos
> >> pero sí tengo una gran cantidad de ceros en la variable dependiente (más
> >> del 90%). Sin embargo, al incluir otro tipo de variables independientes
> >> no
> >> me da ese aviso, dejando la misma variable dependiente.
> >>
> >> ¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
> >> modelo?
> >>
> >> Muchas gracias
> >>
> >> El Lun, 9 de Abril de 2018, 18:48, Carlos J. Gil Bellosta escribió:
> >> > Hola, ¿qué tal?
> >> >
> >> > El "warning" que comentas aparece en glm.fit precisamente cuando un
> >> > coeficiente diverge.
> >> >
> >> > El aviso puede ser malo o irrelevante, depende. Puede que haya sido
> >> > emitido
> >> > en algún paso intermedio del ajuste (por lo que no habría mayor
> >> problema).
> >> > O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es
> >> > malo
> >> > es que algún coeficiente de tu modelo es excesivamente grande. O que
> >> el
> >> > peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo
> >> mismo
> >> > en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
> >> > coeficientes y si tienen cierto sentido a la vista de tus datos.
> >> Vigila
> >> > los
> >> > extremadamente altos.
> >> >
> >> > Si no estás segura de tus coeficientes, puedes implementar el modelo
> >> > generativamente vía stan/rstan. Es sencillo y tendrías buenos
> >> diagnósticos
> >> > de lo que esta ocurriendo.
> >> >
> >> > Un saludo,
> >> >
> >> > Carlos J. Gil Bellosta
> >> > http://www.datanalytics.com
> >> >
> >> >
> >> >
> >> >
> >> > El lun., 9 abr. 2018 a las 18:34, <miriam.alz...@unavarra.es>
> >> escribió:
> >> >
> >> >> Buenas tardes,
> >> >>
> >> >> Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
> >> >> utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me
> >> da
> >> >> el
> >> >> siguiente aviso:
> >> >> Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
> >> >>
> >> >> ¿Sabéis que significa y si puedo usar el modelo aún con ese aviso?
> >> ¿Los
> >> >> coeficientes son fiables?
> >> >>
> >> >> Muchas gracias,
> >> >>
> >> >> Miriam
> >> >>
> >> >> ___
> >> >> R-help-es mailing list
> >> >> R-help-es@r-project.org
> >> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >> >>
> >> >
> >>
> >>
> >>
> >
>
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Warning en modelo ZINB

2018-04-09 Por tema Carlos J. Gil Bellosta

¿Podría ser que para algún nivel de alguna variable independiente
categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese
tipo de warning.

El lun., 9 abr. 2018 a las 19:00, <miriam.alz...@unavarra.es> escribió:

> Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
> pero sí tengo una gran cantidad de ceros en la variable dependiente (más
> del 90%). Sin embargo, al incluir otro tipo de variables independientes no
> me da ese aviso, dejando la misma variable dependiente.
>
> ¿Cómo podría utilizar stan/rstan de forma sencilla para diagnosticar el
> modelo?
>
> Muchas gracias
>
> El Lun, 9 de Abril de 2018, 18:48, Carlos J. Gil Bellosta escribió:
> > Hola, ¿qué tal?
> >
> > El "warning" que comentas aparece en glm.fit precisamente cuando un
> > coeficiente diverge.
> >
> > El aviso puede ser malo o irrelevante, depende. Puede que haya sido
> > emitido
> > en algún paso intermedio del ajuste (por lo que no habría mayor
> problema).
> > O que afecte al ajuste entero. Uno de los síntomas de que el ajuste es
> > malo
> > es que algún coeficiente de tu modelo es excesivamente grande. O que el
> > peso correspondiente a tus ceros esté muy próximo a 0 o 1 (que es lo
> mismo
> > en el contexto de un modelo inflado). Mira a ver qué pinta tienen los
> > coeficientes y si tienen cierto sentido a la vista de tus datos. Vigila
> > los
> > extremadamente altos.
> >
> > Si no estás segura de tus coeficientes, puedes implementar el modelo
> > generativamente vía stan/rstan. Es sencillo y tendrías buenos
> diagnósticos
> > de lo que esta ocurriendo.
> >
> > Un saludo,
> >
> > Carlos J. Gil Bellosta
> > http://www.datanalytics.com
> >
> >
> >
> >
> > El lun., 9 abr. 2018 a las 18:34, <miriam.alz...@unavarra.es> escribió:
> >
> >> Buenas tardes,
> >>
> >> Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
> >> utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da
> >> el
> >> siguiente aviso:
> >> Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
> >>
> >> ¿Sabéis que significa y si puedo usar el modelo aún con ese aviso? ¿Los
> >> coeficientes son fiables?
> >>
> >> Muchas gracias,
> >>
> >> Miriam
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
>
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] problema con shiny

2018-03-04 Por tema Carlos J. Gil Bellosta

Corre perfectamente en mi máquina si borro la última línea (
print(environment(show))).

Simplemente, he creado un directorio vacío (/tmp/prueba), he copiado el
código (menos esa última línea) en el fichero /tmp/prueba/app.R. En una
sesión de R he hecho

library(shiny)
runApp("/tmp/prueba")

Y ha funcionado perfectamente.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El dom., 4 mar. 2018 a las 19:57, Juan Antonio Gil (<j...@edu.uned.es>)
escribió:

> Carlos el código es el ejemplo de shiny:
>
> #
> # This is a Shiny web application. You can run the application by clicking
> # the 'Run App' button above.
> #
> # Find out more about building applications with Shiny here:
> #
> #http://shiny.rstudio.com/
> #
>
> #setwd("C:/curso 2017-18/curso R/shiny/prueba1")
> library(shiny)
>
> # Define UI for application that draws a histogram
> ui <- fluidPage(
>
># Application title
>titlePanel("Old Faithful Geyser Data"),
>
># Sidebar with a slider input for number of bins
>sidebarLayout(
>   sidebarPanel(
>  sliderInput("bins",
>  "Number of bins:",
>  min = 1,
>  max = 50,
>  value = 30)
>   ),
>
>   # Show a plot of the generated distribution
>   mainPanel(
>  plotOutput("distPlot")
>   )
>)
> )
>
> # Define server logic required to draw a histogram
> server <- function(input, output) {
>
>output$distPlot <- renderPlot({
>   # generate bins based on input$bins from ui.R
>   x<- faithful[, 2]
>   bins <- seq(min(x), max(x), length.out = input$bins + 1)
>
>   # draw the histogram with the specified number of bins
>   hist(x, breaks = bins, col = 'darkgray', border = 'white')
>})
> }
>
> # Run the application
> shinyApp(ui = ui, server = server)
> print(environment(show))
>
> El código funciona en otro ordenador con windows 10 con R de 32 bits.
> Donde no funciona es R de 64 bits
> Respecto al directorio no es el problema, está probado.
>
> Saludos,
>
> Juan
>
>
>
> El 04/03/2018 a las 19:48, Carlos J. Gil Bellosta escribió:
>
> Hola, ¿qué tal?
>
> Sin ver el código, es difícil de diagnosticar. Si funcionaba en otro
> ordenador, todavía más.
>
> Buscando ese error por internet decía que puede ocurrir si se ejecuta la
> app desde un directorio que no es el de trabajo. Es raro, pero si, como
> dices, en otro ordenador funcionaba... Pero es puramente especulativo.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
> El dom., 4 mar. 2018 a las 19:18, Juan Antonio Gil (<j...@edu.uned.es>)
> escribió:
>
>> Estimados compañeros tengo un problema con shiny. Es un problema local de
>> mi ordenador, porque en otro va si problemas pero no consigo saber ¿cómo
>> arreglarlo?. He instalado incluso la nueva versión de Rstudio. Os explico:
>>
>> 1) lanzo el programa app.R, el ejemplo de shiny e intenta mostrar los
>> resultados pero si hago: print(environment(show)) da como resultado
>>
>> Error in func(fname, ...) : app.R did not return a shiny.appobj object.
>>
>> pero he mirado en internet el error y no consigo descifrar el problema.
>>
>> ¿Qué puede ser?
>>
>>
>> Saludos,
>>
>> Juan
>>
>>
>>
>> --
>> Juan Antonio Gil Pascual
>> Matemático, estadístico, especialista en Text Mining
>> correo: jm...@telefonica.net<mailto:jm...@telefonica.net>
>> web: www.jgil.acta.es<http://www.jgil.acta.es>
>>
>> AVISO LEGAL. Este mensaje puede contener informació...{{dropped:16}}
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
> --
> Juan Antonio Gil Pascual
> Matemático, estadístico, especialista en Text Mining
> correo: jm...@telefonica.net
>
> web: www.jgil.acta.es
>
>
> *AVISO LEGAL*. Este mensaje puede contener información reservada y
> confidencial. Si usted no es el destinatario no está autorizado a copiar,
> reproducir o distribuir este mensaje ni su contenido. Si ha recibido este
> mensaje por error, le rogamos que lo notifique al remitente.
> Le informamos de que sus datos personales, que puedan constar en este
> mensaje, están incorporados a un fichero titularidad de la UNED cuya
> finalidad es la de mantener el contacto con usted. En cualquier momento
> podrá ejercer sus derechos de acceso, rectificación, cancelación y
> oposición ante la UNED, Departamento de Política Jurídica de Seguridad de
> la Información
> <http://portal.uned.es/portal/page?_pageid=93,24432769,93_24432770&_dad=portal&_schema=PORTAL>,
> o a través de la Sede electrónica <https://sede.uned.es/> de la
> Universidad.
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] problema con shiny

2018-03-04 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Sin ver el código, es difícil de diagnosticar. Si funcionaba en otro
ordenador, todavía más.

Buscando ese error por internet decía que puede ocurrir si se ejecuta la
app desde un directorio que no es el de trabajo. Es raro, pero si, como
dices, en otro ordenador funcionaba... Pero es puramente especulativo.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El dom., 4 mar. 2018 a las 19:18, Juan Antonio Gil (<j...@edu.uned.es>)
escribió:

> Estimados compañeros tengo un problema con shiny. Es un problema local de
> mi ordenador, porque en otro va si problemas pero no consigo saber ¿cómo
> arreglarlo?. He instalado incluso la nueva versión de Rstudio. Os explico:
>
> 1) lanzo el programa app.R, el ejemplo de shiny e intenta mostrar los
> resultados pero si hago: print(environment(show)) da como resultado
>
> Error in func(fname, ...) : app.R did not return a shiny.appobj object.
>
> pero he mirado en internet el error y no consigo descifrar el problema.
>
> ¿Qué puede ser?
>
>
> Saludos,
>
> Juan
>
>
>
> --
> Juan Antonio Gil Pascual
> Matemático, estadístico, especialista en Text Mining
> correo: jm...@telefonica.net<mailto:jm...@telefonica.net>
> web: www.jgil.acta.es<http://www.jgil.acta.es>
>
> AVISO LEGAL. Este mensaje puede contener informació...{{dropped:16}}
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Optimizar función

2018-02-10 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Puedes probar

melt >> summarize >> dcast

Así no tienes que teclear el nombre de las 23 variables numéricas.

Un saludo,

Carlos J. Gil Bellosta
http://ww.datanalytics.com

El sáb., 10 feb. 2018 a las 17:41, Álvaro Hernández (<alvar...@um.es>)
escribió:

> Hola, Andrés:
>
> Con dplyr tienes todas las variantes de 'summarise' para hacer lo que
> dices. Por ejemplo, puedes elegir en qué variables quieres aplicarlo con
> 'summarise_at' o definir una condición con 'summarise_if'.
>
>   * Para aplicar las funciones que definas sobre esas tres variables:
>
> datos %>%
>group_by(distrito) %>%
>summarise_at(vars(Aporte, Ingreso, Edad),
> funs(media = mean, maximo = max, minimo = min, desvio =
> sd))
>
> * Para aplicar esas funciones sobre todas las variables numéricas que
> tengas:
>
> datos %>%
>group_by(distrito) %>%
>summarise_if(is.numeric,
> funs(media = mean, maximo = max, minimo = min, desvio =
> sd))
>
> Un saludo
> Álvaro
>
> El 10/02/18 a las 17:09, Andrés Hirigoyen escribió:
> > Buenas para tod@s, tengo una consulta para poder optimizar tiempos.
> Ejemplo
> > tengo el siguiente dataframe:
> >
> > distrito<-c("A","A","A","B","B","B","C","C","C","A","A","B","B","C")
> > Sex<-c("M","F","M","F","M","F","M","F","M","F","M","F","M","F")
> > Edad<-c(25,36,25,25,25,19,36,39,36,65,54,25,28,28)
> > Ingreso<-c(125,365,265,987,690,369,325,369,789,854,254,268,698,258)
> > Aporte <- c(3,6,3,6,9,6,9,7,9,7,4,8,2,8)
> >
> datos<-data.frame(distrito=distrito,Sex=Sex,Edad=Edad,Ingreso=Ingreso,Aporte=Aporte)
> >
> > Quiero aplicar la function *summarise *del paquete *dplyr *a las 3
> > variables númericas.
> > Para la variable Aporte por ejemplo:
> >
> > descrip<-function(data) {
> >grupos <- group_by(data, distrito)
> >  result <-
> >  summarise(grupos,
> >media = mean(Aporte),
> >maximo = max(Aporte),
> >minimo = min(Aporte),
> >desvio= sd(Aporte)
> >  )
> >  return(result)
> > }
> >
> > Pero me gustaría automatizarla para que corra para todas las variables
> del
> > dataframe  (3 en este caso pero van a ser mas de 23).
> > Sugerencias???
> >
> > Muchas gracias
> > --
> >
> >   [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Excediendo capacidad de cálculo del ordenador

2018-01-19 Por tema Carlos J. Gil Bellosta

Comienza con un subconjunto pequeño de los datos (¿1000?). Luego
increméntalo (¿10k?). Etc. Eso te puede dar idea de lo que puede tardar el
proceso con los datos completos.

Posiblemente puedas paralelizar: estás ajustando el modelo con varios
parámetros distintos secuencialmente. Prueba la paralelización comenzando
primero con datos pequeños.

Prueba también antes con un kernel lineal. Tardará una fracción del tiempo.

Igual puedes determinar los parámetros razonables (mucha gente escribiría
"óptimos" en lugar de "razonables", pero yo no) con un subcojunto y correr
una única vez con ellos en el conjunto de datos completos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El vie., 19 ene. 2018 a las 20:16, Alberto (<alpeda...@hotmail.com>)
escribió:

> Hola a todos,
>
> estoy teniendo problemas a la hora de ejecutar SVM. El ordenador lleva 5
> días encendido pero todavía no ha impreso ningún resultado. Necesito
> consejo sobre como puedo agilizar este proceso o otra forma de realizar la
> misma acción pero con otro código más eficiente. A continuación dejo unas
> indicaciones de los datos a tratar y un ejemplo del código utilizado.
>
> CPU: i7-4710HQ, 8 GB RAM
>
> Datos: entrenamiento - 339701 obs. of 33 variables
>
> Código:
>
> #svm radial
> inicio <- Sys.time()
> ajuste_modelo_svm_radial <- tune(svm, Casualty_Severity~., data =
> entrenamiento, kernel='radial',gamma = c(1,50,100), ranges = list(cost=
> c(10, 100, 1000, 1, 10)))
> summary(ajuste_modelo_svm_radial)
> mejor_modelo_svm_radial <- ajuste_modelo_svm_radial$best.model
> summary(mejor_modelo_svm_radial)
> prediccion_svm_radial <- predict(mejor_modelo_svm_radial, test)
> (table(prediccion=prediccion_svm_radial, verdad = test$Casualty_Severity))
>
> svm_radial_roc <- tune(svm, Casualty_Severity~., data = entrenamiento,
> kernel='radial',gamma = c(1,50,100), ranges = list(cost= c(10, 100, 1000,
> 1, 10)), decision.values =T)
> mejor_modelo_svm_radial_roc <- svm_radial_roc$best.model
> ajuste_roc_svm_radial <- attributes(predict(mejor_modelo_svm_radial_roc,
> test, decision.values= T))$decision.values
> rocplot(ajuste_roc_svm_radial, test$Casualty_Severity, main = 'Test Data')
> print(duracion<-Sys.time()-inicio)
>
>
> Muchas gracias de antemano, un saludo.
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Heat map sin geodatos

2017-12-12 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Tienes un ejemplo en

https://stackoverflow.com/questions/3789549/display-a-matrix-including-the-values-as-a-heatmap

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El mié., 13 dic. 2017 a las 0:23, Alex (<alace...@gmail.com>) escribió:

> ¡Muy buenas!
>
> Este es mi primer mensaje al grupo :)
>
> Estoy haciendo un experimento en un invernadero. Quiero indicar con un mapa
> de calor en qué zonas del invernadero se están recolectando más frutos,
> después de probar varios fertilizantes diferentes. El problema es que todas
> las referencias que encuentro para mapas de calor en R son empleando
> precisamente mapas, o geodatos, etc. Pero lo que yo tengo es un recinto y
> quiero mostrar cómo se distribuye la producción en él.
>
> Había pensado emplear algunas coordenadas locales, y obtener un cuadro como
> este
>
> https://www.packtpub.com/sites/default/files/Article-Images/5644OS_01_01.png
> .
> Algo así hacía antes en Excel, indicando los kg en diferentes celdas y
> después aplicando un formato condicional. Pero quiero saber si hay otras
> alternativas a este tipo de representación.
>
> ¡Gracias y un saludo!
> Alex.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] xlsx Fuera de memoria

2017-11-30 Por tema Carlos J. Gil Bellosta

MIra esto:

https://www.datanalytics.com/2017/11/24/dbf-%C2%B7-xlsx-%C2%B7-pdf/

El paquete que recomienda no usa java. Te ahorras ese problema.

El jue., 30 nov. 2017 a las 18:01, WILMER CONTRERAS SEPULVEDA (<
wilme...@ufps.edu.co>) escribió:

> Hola, estoy trabajando con el paquete xlsx y el xlConnect y ambos presentan
> este mismo error.
>
> Error in .jcall(cell, "V", "setCellValue", value) :
>   java.lang.OutOfMemoryError: Java heap space
>
>
> Alguien conoce una solución.
>
> Alguien conoce otro paquete para guardar documento de excel y que no
> involucre el uso de Java.
> --
>
> *Wilmer Contreras Sepulveda*
>
> *Grupo de Investigación en Desarrollo de Microelectronica Aplicada*
> *Universidad Francisco de Paula Santander *
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Búsqueda de palabras en una variable de R

2017-11-29 Por tema Carlos J. Gil Bellosta

readLines()

El mié., 29 nov. 2017 5:51,  escribió:

> Muchas gracias,
>
> Estoy intentado ejecutar el paquete y necesito importar el archivo txt,
> pero necesito importarlo de modo que cada línea sea una observación y no
> un texto único (tengo unas 63,000 lineas). No encuentro la solución en los
> enlaces. ¿Sabrías como hacerlo?
>
> Gracias!
> El Mar, 28 de Noviembre de 2017, 3:50, Freddy Omar López Quintero escribió:
> > El mar, 28-11-2017 a las 03:42 +0100, miriam.alz...@unavarra.es
> > escribió:
> >> Tengo un vector de 40 palabras (marca) y necesito saber si en una de
> >> las
> >> variables del data.frame (datos) se incluye alguna de esas 40
> >> palabras. Si
> >> se incluye alguna de ellas, me gustaría crear una variable dummy
> >> siendo 1
> >> que incluye alguna palabra y 0 que no incluye.
> >>
> >> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
> >
> > Lo que describes luce como minería de texto y lo que parece que quieres
> > es una porción de la matriz que llaman Term-Document Matrix. El paquete
> > por excelencia para estos menesteres es tm:
> >
> > https://cran.r-project.org/web/packages/tm/
> >
> > que tiene su buena viñeta
> >
> > https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
> >
> > Ojalá sirva.
> >
> > Saludos.
> >
> >
> > --
> > «...homines autem hominum causa esse generatos...»
> >
> > Cicero
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Búsqueda de palabras en una variable de R

2017-11-28 Por tema Carlos J. Gil Bellosta

grep o grepl

El mar., 28 nov. 2017 a las 3:42,  escribió:

> Buenas,
>
> Tengo un vector de 40 palabras (marca) y necesito saber si en una de las
> variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si
> se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1
> que incluye alguna palabra y 0 que no incluye.
>
> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
>
> Gracias!
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] reducir la distancia entre eje X y el texto

2017-11-28 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Hay páginas como

http://research.stowers.org/mcm/efg/R/Graphics/Basics/mar-oma/index.htm

que te enseñan cómo modificar los márgenes de los gráficos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El mar., 28 nov. 2017 a las 12:49, Carlos Fernández-Delgado (<
ba1fe...@uco.es>) escribió:

> Estimados amigos, tengo este data.frame (fig3.csv) al que le aplico el
> siguiente script:
> attach(fig3)
> cols<-c("white", "black","grey")
> barplot(as.matrix(fig3[,2:42]),beside=TRUE,
> legend.text=fig3$Distance,args.legend=list(bty="n"),
> las=3,col=cols, xlab=“Distance moved(m)")
>
> el problema es que la gráfica resultante tiene el texto del eje X
> demasiado separado del propio eje.
> ¿Cómo puedo aproximar este texto un poco más hacia el eje?
> Muchas gracias por adelantado.
> Un saludo cordial
> carlos
>
> **
> Dr. Carlos Fernández-Delgado
> Grupo de Investigación "Aphanius"
> Departamento de Zoología
> Edificio Charles Darwin 3ª pta.
> Campus Universitario de Rabanales
> Universidad de Córdoba
> 14071 Córdoba (Spain)
> Tlfno./Fax: +34 957 218 605 <+34%20957%2021%2086%2005>
> Móvil: 616486912
> correo-e: carlos.fdelg...@uco.es
> http://www.uco.es/aphanius
> *
> Libro sobre los peces del Guadalquivir:
> 1.- Alta resolución, sigue este enlace:
> http://www.uco.es/aphanius/includes/descarga.php?id=16
> 2.- Baja resolución, sigue este otro:
> https://issuu.com/sibic/docs/peces-dulceacuicolas-guadalquivir
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Control de tiempo de ejecución

2017-11-14 Por tema Carlos J. Gil Bellosta

> system.time(Sys.sleep(3))
   user  system elapsed
  0.000   0.000   3.003


El mar., 14 nov. 2017 a las 22:11, Andres Hirigoyen (<
andreshirigo...@gmail.com>) escribió:

> Buenas tardes
> ¿Cómo puedo controlar el tiempo que demora en ejecutarse una rutina de
> forma automática?
>
> Probé con  proc.time()pero no es automático, tengo que pararlo yo.
>
> Muchas gracias como siempre
>
>
> --
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problemas con función factor to integer

2017-11-04 Por tema Carlos J. Gil Bellosta

foo <- function(x){
  tmp <- as.character(x)
  tmp <- gsub("X", "", tmp)
  as.integer(tmp)
}

road_accidents$Vehicle_Type <- foo(road_accidents$Vehicle_Type)

Si estás con R, comienza por el principio: cómo se definen funciones y qué
devuelven. Luego, qué son y cómo se opera con factores. Deja el %>%
chachiguay para el final.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El sáb., 4 nov. 2017 a las 12:44, Alberto (<alpeda...@hotmail.com>)
escribió:

> Muchas gracias por contestar.
>
> Sigo sin conseguir resultados. He probado con lo que me has sugerido de
> dos formas:
>
> get.integer3 <- function(x,y)
> {
>   vector <- x$y
>   vector <- str_replace(vector, 'X', '')
>   vector <- as.integer(as.character(vector))
>   x$y <- vector
> }
>
> get.integer3 <- function(x,y)
> {
>   vector <- x$y
>   vector <- as.character(vector)
>   vector <- str_replace(vector, 'X', '')
>   vector <- as.integer(vector)
>   x$y <- vector
> }
>
> Realmente consigo que R haga lo que le pido con los comandos por separado:
>
> road_accidents$Vehicle_Type <- str_replace(road_accidents$Vehicle_Type,
> 'X','')
> road_accidents$Vehicle_Type <- as.integer(road_accidents$Vehicle_Type)
>
> Sin embargo, quiero implementar esto en una función para no tener que ir
> variable por variable.
>
> Otra forma que se me ha ocurrido de hacerlo es obtener la posición que
> ocupa la variable en el data frame para así, en vez de hacer referencia a
> ella a través de x$y, llamar directamente a la columna mediante
> road_accidents[,3*] (*por poner un ejemplo). El problema es que esto no se
> como hacerlo.
>
> Un saludo.
> 
> From: Francisco Rodríguez <fjr...@hotmail.com>
> Sent: Friday, November 3, 2017 7:00 PM
> To: Alberto; r-help-es@r-project.org
> Subject: Re: [R-es] Problemas con función factor to integer
>
> Por lo que veo tus datos son factor, creo que primero debes transformarlos
> a character. Saludos
>
>
>
> Enviado desde mi smartphone Samsung Galaxy.
>
>
>  Mensaje original 
> De: Alberto <alpeda...@hotmail.com>
> Fecha: 3/11/17 18:20 (GMT+01:00)
> Para: r-help-es@r-project.org
> Asunto: [R-es] Problemas con función factor to integer
>
> Hola,
>
> estoy teniendo problemas para conseguir que mi funci�n haga lo que quiero.
> Necesito que coja los valores de la variable que le indico, le quite la
> letra que precede a dichos valores y los convierta en n�meros enteros. Dejo
> un ejemplo de los datos que estoy tratando y de varias opciones de funci�n
> con las que intento que funcione sin resultado.
>
> #Ejemplo
> > head(road_accidents$Vehicle_Type,10)
>  [1] X2  X11 X11 X19 X11 X11 X11 X11 X11 X11
> Levels: X10 X11 X17 X19 X2 X20 X21 X3 X4 X5 X8 X9 X90 X97 X98
>
> #Funci�n Prueba 1
> get.integer <- function(x)
> {
>   road_accidents %>%
> str_replace(road_accidents$x, 'X','') %>%
> as.integer(road_accidents$x)
> }
>
> #Funci�n Prueba 2
> get.integer2 <- function(dataframe, y)
> {
>   vector <- str_replace(dataframe[,y], 'X', '')
>   vector <- as.integer(dataframe[,y])
>   dataframe[,y] <- vector
> }
>
> #Funci�n Prueba 3
> get.integer3 <- function(x,y)
> {
>   vector <- x$y
>   vector <- str_replace(vector, 'X', '')
>   vector <- as.integer(vector)
>   x$y <- vector
> }
>
> Gracias, un saludo.
>
> [[alternative HTML version deleted]]
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] consulta

2017-07-07 Por tema Carlos J. Gil Bellosta

https://cran.r-project.org/web/packages/simmer/index.html

Mira las viñetas.

El vie., 7 jul. 2017 a las 20:15, Tania mayra ()
escribió:

> deseo ayuda sobre como iniciar este proyecto en r:
>
> ## Cuerpo del proyecto
> Para este proyecto, deben generar un $M/G/\infty$ para las siguientes
> distribuciones:
>
> 1. G es la función de distribución de una variable "aleatoria" constante.
> 2. G es la función de distribución de una variable aleatoria Geométrica
> parámetro $p=\frac{\lambda}{\mu}$ con $\lambda < \mu$
> 3. G es la distribución de una variable aleatoria $Exp(\mu)$
>
> En cada caso, estime empíricamente **$S=$ el tiempo promedio que pasa un
> cliente en el sistema una vez que el mismo ha alcanzado su estado estable**
> y ** $L=$ el número promedio de clientes en el sistema una vez que el mismo
> ha alcanzado su estado estable** y trate de verificar si se cumple la *ley
> de Little*, que en este caso se enuncia como $L=\lambda S$, para esos tres
> sistemas cuando $\lambda=2/hora$ y $\mu=3/hora$.
>
>
>
> Gracias de antemano.
>
> --
> La información contenida en este e-mail y sus anexos es confidencial,
> privilegiada y está dirigida exclusivamente a su destinatario, en
> consecuencia, solo puede ser utilizada por aquel. Si usted no es el
> destinatario original, no deberá examinar, usar, copiar o distribuir este
> mensaje o la información que contiene. Si lo recibe por error, por favor
> reenvíelo a la persona que se lo envió y elimínelo. Cualquier retención o
> uso total o parcial no autorizada de este mensaje está estrictamente
> prohibida y sancionada por ley.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Big datasheet

2017-07-02 Por tema Carlos J. Gil Bellosta

Todo el mundo está usando esto
.

Si quieres ser más original, prueba con los microdatos del español de 2011,
que viene a ser un par de GB.


El 2 de julio de 2017, 19:05, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Alguien sabe donde puedo encontrar algun datasheet gigante, de más de 5
> gigas, para poder practicar con grandes volumenes de información?
>
> Lo que quiero es probar a cargarlos con h20 y crear  modelos con ellos. Me
> gustaria sobretodo problemas de clasificación...
>
> Gracias
>
> Jesús
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-24 Por tema Carlos J. Gil Bellosta

Los datos del WWS están disponibles en R en la página de descarga. No hay
que traducirlos.

Si los bajas periodo a periodo filtrando las variables (seguro que no
quieres las mil a la vez, ¿verdad?), caben de sobra.

Tienes un ejemplo de carga de datos del WWS aquí
<https://www.datanalytics.com/2014/11/28/como-no-tengo-tiempo-voy-a-publicar-una-chorrada-y-una-coda/>
.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 24 de junio de 2017, 18:11, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> escribió:

> Francisco
>
> Uno de los ficheros de 1981 a 2014 esta en formato rdata, y el otro está en
> formato SPSS o STATA. Creo que lo que dices solo vale para ficheros txt, o
> csv. Mi idea es luego combinarlos mediante rbind ambos datos, lo mismo que
> hace el comando append en STATA.
>
> Gracias
>
> 2017-06-24 9:08 GMT-05:00 Francisco Rodríguez <fjr...@hotmail.com>:
>
> > Puedes cambiar el formato de datos?  Pásalo a txt o csv y usa la librería
> > data.table No sé si data.table permite leer directamente de spss. Un
> > saludo
> >
> > Enviado desde mi smartphone Sony Xperia™
> >
> >
> >  Antonio Rodriguez Andres escribió 
> >
> > Buenos días
> >
> > Estoy intentando leer una base de datos correspondiente al World Values
> > Survey desde 1981 a 2014. Contiene variables por columnas, y
> observaciones
> > correspondientes a individuos
> > de diferentes países. Podría tener como aprox. 1000 variables, y mas de
> > 60,000 individuos por año. Esta es la información que obtengo de mi
> > RStudio.
> >
> > > sessionInfo()R version 3.3.2 (2016-10-31)
> > Platform: x86_64-w64-mingw32/x64 (64-bit)
> > Running under: Windows >= 8 x64 (build 9200)
> >
> >
> > El ordenador portatil tiene las siguientes especificaciones, RAM
> INSTALADO
> > : 4GB
> >
> >
> > Cuando intento leer el data frame, lo que obtengo es ese mensaje de
> error.
> > He intentado cambiar el memory limit, pero no consigo leerlo.
> >
> > > vws = read_spss("WVS_Longitudinal_1981_2014_spss_v2015_04_18.
> sav")Error:
> > cannot allocate vector of size 2.6 Mb
> >
> > Alguna sugerencia de como podría leer los datos.
> >
> >
> >
> > Gracias por anticipado
> >
> > Antonio
> >
> >
> >
> > --
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
>
>
> --
>
> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
> SAGE journal)
>
> http://elr.sagepub.com/
>
> Member, Editorial Committee, African Journal of Economic and Management
> Studies
>
> http://emeraldgrouppublishing.com/products/journals/
> editorial_team.htm?id=ajems
>
> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
> profile)
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Contacting Delphi...the oracle is unavailable

2017-06-20 Por tema Carlos J. Gil Bellosta

No es virus, no es "bug", es "feature":

http://r.789695.n4.nabble.com/Contacting-Delphi-td4645736.html

El 20 de junio de 2017, 18:11, Mauricio Monsalvo 
escribió:

> Muchas gracias a todos!
> Confirmo que editando el código para eliminar los  funcionó y dejó de
> aparecer el bug. Una buena.
> Por lo demás, utilizo siempre UTF-8 tanto para los datos como para el
> editor de sintaxis de RStudio, pero se conoce que en algún momento pegué
> algo que lo molestó y cambió el Encoding, probablemente al cerrar y volver
> a abrir.
> Por ahora, seguimos adelante.
>
>
> El 20 de junio de 2017, 12:41, patricio fuenmayor <
> patricio.fuenma...@gmail.com> escribió:
>
> > Hola.
> > Para el tema del encoding, recomiendo usar Notepad++, tiene la opción de
> > convertir entre encodings.
> > Yo opté por homologar todos mis scripts a UTF-8, ya que trabajo en linux
> y
> > en windows.
> > Si a pesar de esto se tiene problemas, yo ejecuto:
> > options(encoding="UTF-8"), desafortunadamente esto no funciona para R
> > Notebook, ya que no compila y sale un error
> >
> > Saludos.
> >
> >
>
>
> --
> Mauricio
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Por tema Carlos J. Gil Bellosta

1) Agrega por país y nivel (en freq).
2) Por país, haz algo así como pct = 100 * freq / sum(freq).

Con plyr, dos líneas.

El 19 de junio de 2017, 0:20, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> escribió:

> Gracias. Alguna idea de que usar para calcular los porcentajes y
> almacenarlos. Se puede usar flat table?
>
> El 18/06/2017 4:50 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
> escribió:
>
>> Los porcentajes que obtienes con tu código son sobre todas las facetas,
>> no país a país.
>>
>> Calcula los porcentajes previamente a por país y representa esa columna
>> en las barras.
>>
>> Un saludo,
>>
>> Carlos J. Gil Bellosta
>> http://www.datanalytics.com
>>
>>
>>
>> El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
>> antoniorodriguezandre...@gmail.com> escribió:
>>
>>> Estimados
>>>
>>> Soy un nuevo usario de R, y estoy usando como base de datos el European
>>> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
>>> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
>>> el año 2014.
>>>
>>> He leido los datos, desde SPSS y aquí tienen la base de datos y que tipo
>>> de objetos se han generado, y tambíen la distribución por pais de la
>>> muestra. No he usado los weights del survey todavía, solo estoy explorando
>>> los datos.
>>>
>>> class(ess)
>>>
>>> ## [1] "lbl_df" "data.frame"
>>>
>>> frq(ess$cntry)
>>>
>>> ## # Country
>>> ##
>>> ##  val  label  frq raw.prc valid.prc cum.prc
>>> ##1Austria 17954.47  4.474.47
>>> ##2Belgium 17694.40  4.408.87
>>> ##3Switzerland 15323.81  3.81   12.68
>>> ##4 Czech Republic 21485.35  5.35   18.03
>>> ##5Germany 30457.58  7.58   25.60
>>> ##6Denmark 15023.74  3.74   29.34
>>> ##7Estonia 20515.10  5.10   34.45
>>> ##8  Spain 19254.79  4.79   39.24
>>> ##9Finland 20875.19  5.19   44.43
>>> ##   10 France 19174.77  4.77   49.20
>>> ##   11 United Kingdom 22645.63  5.63   54.83
>>> ##   12Hungary 16984.23  4.23   59.06
>>> ##   13Ireland 23905.95  5.95   65.01
>>> ##   14 Israel 25626.38  6.38   71.38
>>> ##   15  Lithuania 22505.60  5.60   76.98
>>> ##   16Netherlands 19194.78  4.78   81.76
>>> ##   17 Norway 14363.57  3.57   85.33
>>> ##   18 Poland 16154.02  4.02   89.35
>>> ##   19   Portugal 12653.15  3.15   92.50
>>> ##   20 Sweden 17914.46  4.46   96.95
>>> ##   21   Slovenia 12243.05  3.05  100.00
>>> ##   NA NA00.00NA  NA
>>> Ahora voy a hacer un histograma de la variable satisfaccion con la
>>> vida,  cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica
>>> mayor satisfacción con la vida.
>>>
>>> get_labels(ess$stflife)
>>>
>>>
>>> ##  [1] "Extremely dissatisfied" "1"
>>> ##  [3] "2"  "3"
>>> ##  [5] "4"  "5"
>>> ##  [7] "6"  "7"
>>> ##  [9] "8"  "9"
>>> ## [11] "Extremely satisfied""Refusal"
>>>
>>> ## [13] "Don't know" "No answer"
>>>
>>> Lo que he hecho es hacer una tabla de la distribución de esa variable
>>> para un sólo pais Dinamarca (DK)
>>>
>>> flat_table(subset(ess, cntry %in% c("DK")), stflife, margin= "row")
>>>
>>> ## x 0 1 2 3 4 5 6 7 8 910
>>> ##
>>>
>>> ##0.33  0.27  0.47  1.33  0.93  2.87  3.67  8.20 28.40 29.53 24.00
>>>
>>>
>>> Sin embargo al hacer un histrogama para los paises con ggplot, anda algo
>>> mal con los porcentajes. Por ejemplo sabemos que un 24 % respondió que
>>> están muy satisfechos en DK. Sin embargo
>>>
>>> los porcentajes son muy pequeños.
>>>
>>>
>>> myplot = ggplot(ess, aes (stflife)) +
>>>   geom_bar(aes(y = (..count..)/sum(..count..))) +
>>>   scale_y_continuous(labels=scales::percent) +
>>>   ylab("Relative frequencies") + facet_wrap(~cntry)
>>>
>>> plot(myplot)
>>>
>>> [image: Inline images 1]
>>>
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Por tema Carlos J. Gil Bellosta

Los porcentajes que obtienes con tu código son sobre todas las facetas, no
país a país.

Calcula los porcentajes previamente a por país y representa esa columna en
las barras.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> escribió:

> Estimados
>
> Soy un nuevo usario de R, y estoy usando como base de datos el European
> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
> el año 2014.
>
> He leido los datos, desde SPSS y aquí tienen la base de datos y que tipo
> de objetos se han generado, y tambíen la distribución por pais de la
> muestra. No he usado los weights del survey todavía, solo estoy explorando
> los datos.
>
> class(ess)
>
> ## [1] "lbl_df" "data.frame"
>
> frq(ess$cntry)
>
> ## # Country
> ##
> ##  val  label  frq raw.prc valid.prc cum.prc
> ##1Austria 17954.47  4.474.47
> ##2Belgium 17694.40  4.408.87
> ##3Switzerland 15323.81  3.81   12.68
> ##4 Czech Republic 21485.35  5.35   18.03
> ##5Germany 30457.58  7.58   25.60
> ##6Denmark 15023.74  3.74   29.34
> ##7Estonia 20515.10  5.10   34.45
> ##8  Spain 19254.79  4.79   39.24
> ##9Finland 20875.19  5.19   44.43
> ##   10 France 19174.77  4.77   49.20
> ##   11 United Kingdom 22645.63  5.63   54.83
> ##   12Hungary 16984.23  4.23   59.06
> ##   13Ireland 23905.95  5.95   65.01
> ##   14 Israel 25626.38  6.38   71.38
> ##   15  Lithuania 22505.60  5.60   76.98
> ##   16Netherlands 19194.78  4.78   81.76
> ##   17 Norway 14363.57  3.57   85.33
> ##   18 Poland 16154.02  4.02   89.35
> ##   19   Portugal 12653.15  3.15   92.50
> ##   20 Sweden 17914.46  4.46   96.95
> ##   21   Slovenia 12243.05  3.05  100.00
> ##   NA NA00.00NA  NA
> Ahora voy a hacer un histograma de la variable satisfaccion con la vida,
> cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica mayor
> satisfacción con la vida.
>
> get_labels(ess$stflife)
>
>
> ##  [1] "Extremely dissatisfied" "1"
> ##  [3] "2"  "3"
> ##  [5] "4"  "5"
> ##  [7] "6"  "7"
> ##  [9] "8"  "9"
> ## [11] "Extremely satisfied""Refusal"
>
> ## [13] "Don't know" "No answer"
>
> Lo que he hecho es hacer una tabla de la distribución de esa variable para
> un sólo pais Dinamarca (DK)
>
> flat_table(subset(ess, cntry %in% c("DK")), stflife, margin= "row")
>
> ## x 0 1 2 3 4 5 6 7 8 910
> ##
>
> ##0.33  0.27  0.47  1.33  0.93  2.87  3.67  8.20 28.40 29.53 24.00
>
>
> Sin embargo al hacer un histrogama para los paises con ggplot, anda algo
> mal con los porcentajes. Por ejemplo sabemos que un 24 % respondió que
> están muy satisfechos en DK. Sin embargo
>
> los porcentajes son muy pequeños.
>
>
> myplot = ggplot(ess, aes (stflife)) +
>   geom_bar(aes(y = (..count..)/sum(..count..))) +
>   scale_y_continuous(labels=scales::percent) +
>   ylab("Relative frequencies") + facet_wrap(~cntry)
>
> plot(myplot)
>
> [image: Inline images 1]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Regresión ponderada

2017-06-14 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Una pregunta muy tonta: ¿has tomado logaritmos?

La dispersión que dices que es muy alta al principio, ¿sigue siendo muy
superior a la del final después de tomar logaritmos?

Porque si lo que tienes es un decaimiento exponencial, después de tomar
logaritmos deberías ver algo parecido a una recta, la típica que acompaña
en los textos a la regresión lineal simple. Y si no, no tienes decaimiento
exponencial sino otra cosa.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 14 de junio de 2017, 21:35, Gerardo Gold <gerardo.gold@gmail.com>
escribió:

> Colegas:
>
> Necesito hacer una serie de ajustes de un modelo de decaimiento exponencial
> a unos datos de concentración de compuestos fluorescentes contra el tiempo.
> Para la mayoría de los experimentos tengo tres réplicas por cada tiempo, y
> haciendo los gráficos correspondientes parece haber diferencias muy grandes
> en la dispersión de los datos, siendo generalmente mas grandes al principio
> del experimento que al final.
>
> Quiero hacer el ajuste de un modelo ponderado para tomar en cuenta las
> diferencias en la dispersión de los datos. Tengo los datos en un "data
> frame" donde tengo los tiempos en una columna, y los valores de
> concentración en otra. Los datos están en forma individual, o sea que tengo
> por lo menos tres valores de concentración por cada tiempo.
>
> Para el caso de datos agrupados, donde ya se tiene la desviación estándar o
> varianza calculada ajustar un modelo ponderado es fácil, pero no se como
> hacerlo con datos sin agrupar.
>
> Podría alguien ayudarme por favor?
>
> Gracias anticipadas,
>
> Gerardo
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] package ‘rgdal’ is not available (for R version 3.2.3)

2017-06-12 Por tema Carlos J. Gil Bellosta

Prueba con una versión no antigua de R.

El lun., 12 jun. 2017 4:36, javier valdes  escribió:

> Estimados:
> Es posible solucionar este tema?? He probado con varias alternativas
> disponibles en internet, pero ninguna me ha funcionado aun.
> Saludos.
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] errores con openair

2017-06-01 Por tema Carlos J. Gil Bellosta

Revisa el formato de tus fechas.

El 1 de junio de 2017, 21:46, Javier Valdes Cantallopts (DGA) <
javier.val...@mop.gov.cl> escribió:

> Estimados como les va.
>
>
>
> He tratado de profundizar sobre el paquete OPENAIR PARA MANEJO DE DATOS.
> Sin embargo, cada cosa que intento hacer, por muy pequeña que sea, me tira
> este error. En definitiva, no he podido hacer absolutamente nada¡¡
>
> He probado de todo, pero ya me estoy aburriendo, a pesar que al parecer es
> una muy buena herramienta.
>
> Saludos.
>
>
>
> Error in as.POSIXct.default(x) :
>
>   do not know how to convert 'x' to class “POSIXct”
>
> In addition: Warning message:
>
> In is.na(mydata$date) :
>
>   is.na() applied to non-(list or vector) of type 'NULL'
>
>
>
> [image: Descripción: FIRMA3]
>
>
>
> --
>
> CONFIDENCIALIDAD: La información contenida en este mensaje y/o en los
> archivos adjuntos es de carácter confidencial o privilegiada y está
> destinada al uso exclusivo del emisor y/o de la persona o entidad a quien
> va dirigida. Si usted no es el destinatario, cualquier almacenamiento,
> divulgación, distribución o copia de esta información está estrictamente
> prohibido y sancionado por la ley. Si recibió este mensaje por error, por
> favor infórmenos inmediatamente respondiendo este mismo mensaje y borre
> todos los archivos adjuntos. Gracias.
>
> CONFIDENTIAL NOTE: The information transmitted in this message and/or
> attachments is confidential and/or privileged and is intented only for use
> of the person or entity to whom it is addressed. If you are not the
> intended recipient, any retention, dissemination, distribution or copy of
> this information is strictly prohibited and sanctioned by law. If you
> received this message in error, please reply us this same message and
> delete this message and all attachments. Thank you.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Hacer una gráfico de dispersión y línea de tendencia.

2017-04-28 Por tema Carlos J. Gil Bellosta

Mira los ejemplos de ?abline.

El 29 de abril de 2017, 1:03, alejandro hernández morales <
hdezmor...@gmail.com> escribió:

> Buenas. Espero me pueda ayudar. Tengo dos variables cuantitativas, quiero
> aplicar un gráfico de dispersión y aplicarle una línea de tendencia, Pero
> no veo la manera de hacerlo. Agradecería su ayuda. Muchas gracias.
>
> --
> *Alejandro Hernández Morales*
> *Departamento de Biología Marina*
> Centro Interdisciplinario de Ciencias Marinas (CICIMAR)
> Instituto Politécnico Nacional (IPN)
> La Paz, B. C. S.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] ggplot dentro de una función

2017-04-28 Por tema Carlos J. Gil Bellosta

Usa aes_string en lugar de aes. Mira la documentación.

2017-04-28 23:39 GMT+02:00 Rubén Coca :

> Hola a todos,
> Partiendo de:
>
> library(ggplot2); library(data.table)
>
> datos <- data.table(Date = seq.Date(as.Date("2017-01-01"),
>  as.Date("2017-01-10"),
>  by = "day"),
>  V1 = rnorm(10),
>  V2 = rnorm(10))
>
> Quiero crear una función para pintar un gráfico cuyos argumentos sean el
> data table y la variable a pintar en el eje de las x. Se me ocurre ésta:
>
> grafico <- function(dt, varx) {
>   ggplot(dt, aes(x = Date, y = varx)) +
> geom_point()
>   ## un montón de código de configuración del gráfico, etc
> }
>
> grafico(datos, V1)
>
> Pero ggplot dice que no encuentra V1...
> Error in eval(expr, envir, enclos) : object 'V1' not found
> In addition: Warning message:
> In eval(expr, envir, enclos) : restarting interrupted promise evaluation
>
> Alguna sugerencia o nuevo enfoque?
> Muchas gracias
>
> Rubén
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] RStudio en Ubuntu 17.10

2017-04-27 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si libgstreamer0.10-0 es una dependencia de RStudio, instálala primero con

sudo apt-get install libgstreamer0.10-0

Una vez instalada, podrás correr

sudo dpkg -i rstudio_blablabla.deb

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 27 de abril de 2017, 21:46, Manuel Máquez <manuelm...@gmail.com>
escribió:

> Estimados Colegas:
>
> Como antecedentes les informo:
> a).-Traté de actualizar mi sistema de Ubuntu 16.10 a 17.04; sin embargo una
> falla de electricidad me cortó la instalación.
> b).- Me vi en la necesidad de reinstalar, pero formateando lo que tenía
> instalado, entre otros RStudio.
>
> Ahora que he estado tratar de recuperar la versión 1.0.143-i386, de
> RStudio, que tenía me encuentro que se debe instalar libgstreamer0.10-0 y
> aunque la bajé, no logro instalarla, a pesar de estar en la carpeta donde
> reside y donde he ejecutado sudo dpkg -i.
>
> Pero aun más traté de instalar la versión 0.99.896-i386 de Rstudio y
> también me solicitó la misma librería.
>
> Alguno de ustedes me podría hacer el favor de orientarme para lograr volver
> a tener RStudio.
>
> Anticipo las más cumplidas gracias.
>
> *MANOLO MÁRQUEZ P.*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Matriz como producto de vectores.

2017-04-17 Por tema Carlos J. Gil Bellosta

a <- 1:4
b <- 3:6
a %*% t(b)


El 17 de abril de 2017, 17:26, Horacio  escribió:

> Buenas tengo una matriz de contingencia de 5x4 donde en la última fila
> y última columna tengo las frecuencias marginales, en función de estas
> quiero sacar las esperadas, pero cuando hago por ejemplo el producto,,
>
> Esperadas<-Estrategia["Suma",]*Estrategia[,"Suma_e"]
>E1E2E3E4  Suma
>  5550 14160 52650 89600 20720
> Warning message:
> In Estrategia["Suma", ] * Estrategia[, "Suma_e"] :
>   longitud de objeto mayor no es múltiplo de la longitud de uno menor
>
> me da un vector y no una matriz,,, como puedo hacer esto? no sé si se
> entiende lo que busco
>
> Gracias,,,
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] GLM con clusters

2017-03-22 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Tienes una discusión sobre esos asuntos aquí
<http://rpsychologist.com/r-guide-longitudinal-lme-lmer>. Puedes usar los
paquetes lmer o nlme (me decantaría por el primero).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 22 de marzo de 2017, 17:48, Sebastian Gadea <sebastiangadea...@gmail.com>
escribió:

> Gracias a todos por sus respuestas, perdón si no fui muy claro.
>
> Lo que intento replicar es un análisis realizado en Stata, tengo que hacer
> los mismos cálculos pero en el r.
>
> En Stata lo que se hizo fue:
>
> xi: logistic i.coord i.v11_sexo, vce (cluster red)
>
>
> *Vce (cluster clustvar) especifica que los errores estándar permiten la
> correlación intragrupo, relajando el requisito habitual de que las
> observaciones sean independientes. Es decir, las observaciones son
> independientes entre grupos (grupos) pero no necesariamente dentro de los
> grupos. *
> http://www.stata.com/manuals13/rvce_option.pdf
>
>
> O sea, quitan el supuesto de independencia entre observaciones de un mismo
> grupo, en este lo indica la variable red. Pero ésto no afecta la estimación
> de los coeficientes, si los intervalos de confianza.
>
>
> El 22 de marzo de 2017, 13:38, Xavi tibau alberdi <xaviti...@gmail.com>
> escribió:
>
> > Buenas,
> >
> > No estoy muy seguro de porqué quieres hacer esto. Si no te entiendo mal,
> > quieres hacer una regresión logística, y con los resultados un análisis
> de
> > clústers. Quizá lo mejor seria usar ambos métodos de predicción y
> comparar
> > los resultados. Aún así, si te he entendido bien, entonces la manera de
> > hacerlo sería: primero la regresión y luego recuperas las predicciones.
> Por
> > ejemplo:
> >
> > mylogit <- glm(variable ~ ., data = df, family = "binomial") #Regresion
> > logistica
> >
> > summary(mylogit) #Ves que tal ha quedado.
> >
> > Puedes recuperar las prediciones con 'mylogit$fitted.values' y las puedes
> > poner en el dataframe original
> >
> > df$fitted <- mylogit$fitted.values
> >
> > Luego, puedes realizar un análisis de clusters usando las predicciones.
> >
> > Como se trata de una regresión logística, tendira sentido que antes del
> > analisis redondees los resultados hacia 1 o hacia 0.
> >
> > Espero que esto te sirva.
> >
> > Un saludo,
> >
> > Xavier Tibau
> >
> >
> >
> >
> >
> >
> >
> >
> > 2017-03-22 16:33 GMT+01:00 Sebastian Gadea <sebastiangadea...@gmail.com
> >:
> >
> >> Buenas tardes,
> >>
> >> desde Uruguay, quiero realizar una regresión logística,con la función
> GLM,
> >> pero ademas quiero designarle a las observaciones clusters.
> >>
> >> La idea es decirle al programa que las observaciones corresponden a
> >> diferentes clusters.
> >>
> >>
> >> Saludos!
> >> Sebastián.
> >>
> >> [[alternative HTML version deleted]]
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >
>
>
> --
> Saludos!
> Sebastián.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Pregunta (debate) sobre licencia R

2017-03-16 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Pues eso depende de lo que hayas firmado. Frecuentemente, el código
pertenece  la organización que paga su desarrollo. Si trabajas (con
contrato laboral), casi seguro que el código pertenece a tu empleador.

Si eres ajeno, depende. Pero lo normal es que:

1) Si el cliente se dedica a vender código, te haya hecho firmar que el
código le pertenece.
2) Si el cliente solo quiere usar el código, casi seguro le da igual que lo
uses en otro lado. La restricción puede venir por otra parte (por ejemplo,
si el código implementa un algoritmo o método propio de esa empresa).

Yo lo he visto todo. Incluido pasarse todas esas reglas a la torera sin que
haya pasado nada en absoluto (en España).

Un saludo,

Carlos J. Gil Bellosta
http://www.datatanalytics.com



El 16 de marzo de 2017, 18:04, Francisco Rodríguez <fjr...@hotmail.com>
escribió:

> Hola Carlos, buenas tardes,
>
>
> Pongamos un caso sencillo, un programa escrito enteramente en R que hago
> para un cliente para resolver un problema de negocia
>
>
> Me refiero a exactamente a alguna de las siguientes situaciones:
>
>
> 1 Alguien me lo copia sin mi permiso y lo usa e incluso lo publica
>
>
> 2 ¿Alguien ajeno a mi empresa y/o cliente podria tener el derecho de
> exigir que le entregase ese codigo?
>
>
> Ojo, no se me ha dado el caso ni voy a denunciar a nadie, es solo
> curiosidad
>
>
> --
> *De:* gilbello...@gmail.com <gilbello...@gmail.com> en nombre de Carlos
> J. Gil Bellosta <c...@datanalytics.com>
> *Enviado:* jueves, 16 de marzo de 2017 16:59
> *Para:* Francisco Rodríguez; r-help-es
> *Asunto:* Re: [R-es] Pregunta (debate) sobre licencia R
>
> Hola, ¿qué tal?
>
> ¿Qué significa "basado en R"? ¿Modificando el código fuente de R? No te
> refieres a "un programa escrito en R", ¿verdad?
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
> datanalytics - Estadística y análisis de datos
> <http://www.datanalytics.com/>
> www.datanalytics.com
> Davidi: Está claro que se reinventa mucho nombre, a veces un poco de...
> Jorge Martín: por cierto acabo de enterarme de que existe R-ladies.
> Esperaré...
>
>
> El 16 de marzo de 2017, 17:43, Francisco Rodríguez <fjr...@hotmail.com>
> escribió:
>
>> Hola buenos días, una pregunta que quiero realizar de R sobre el tema de
>> la licencia y que me inquieta un poco, a ver si alguien me la puede
>> responder de un modo suficientemente claro o referirme a algún sitio donde
>> informarme porque yo por el momento estoy un poco liado.
>>
>>
>> Imaginemos el siguiente ejemplo. Una empresa crea un software totalmente
>> basado en R para comercializarlo o alguien realiza un proyecto de
>> consultoría (a modo freelance) con este fin, ... (o ejemplo con esa idea)
>>
>>
>> Pregunta 1: Si yo me entero de ese desarrollo ¿Tendría yo derecho a
>> exigir que se me pase el código fuente de todo lo realizado o de que
>> estuviese disponible para su descarga?
>>
>>
>> Pregunta 2: Si alguien de forma (seguro no ética e ilegal no sé si las
>> dos cosas o una de ellas) colgase en algún sitio el código fuente y alguien
>> lo descargase y lo revendiese ¿Tendría el creador derecho a ser idemnizado
>> por plagio?
>>
>>
>> Un saludo y muchas gracias por las respuestas que me deis
>>
>> [[alternative HTML version deleted]]
>>
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] R <- POO

2017-03-15 Por tema Carlos J. Gil Bellosta

De hecho, dos de los principios de diseño de R son:

1) Todo lo que existe es un objeto.
2) Todo lo que sucede es una llamada a una función.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 15 de marzo de 2017, 14:22, <miguel.angel.rodriguez.mui...@sergas.es>
escribió:

> Disiento, Javier.
>
> R sí es un lenguaje orientado a objetos.
>
> :-)
>
>
> Un saludo,
> Miguel.
>
>
>
> El 15/03/2017 a las 13:43, javier.ruben.marcu...@gmail.com javier.ruben.marcu...@gmail.com> escribió:
>
> R es un lenguaje medio complicado, no es orientado a objetos, aunque hay
> formas para un trabajo con objetos, por otro lado se puede definir una
> función o emplear 5 paquetes para lo mismo en dos líneas de código.
>
>
>
>
>
> 
>
> Nota: A información contida nesta mensaxe e os seus posibles documentos
> adxuntos é privada e confidencial e está dirixida únicamente ó seu
> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
> por favor elimínea. A distribución ou copia desta mensaxe non está
> autorizada.
>
> Nota: La información contenida en este mensaje y sus posibles documentos
> adjuntos es privada y confidencial y está dirigida únicamente a su
> destinatario/a. Si usted no es el/la destinatario/a original de este
> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
> está autorizada.
>
> See more languages: http://www.sergas.es/aviso-confidencialidad
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Merge con fechas

2017-03-08 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

La mejor manera es transformar la tabla2 en otra con la estructura cliente
- fecha - orden. Es decir, algo así como

cliente / fecha / orden
cli1 / dia1 / 1
cli1 / dia2 / 2
cli2 / dia3 / 1
cli2 / dia4 / 2
cli2 / dia5 / 3
...

Luego haces el join por fecha. Y en la tabla final, seleccionas los
registros con el primer orden por cliente.

Y más en general, lee esto
<https://www.jstatsoft.org/article/view/v059i10/v59i10.pdf>. La solución a
casi todos los problemas del tipo "no quiero hacer X tantas veces como
columnas tengo" es poner los datos en formato largo / ordenado / arreglado.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 8 de marzo de 2017, 8:38, jose luis via R-help-es <
r-help-es@r-project.org> escribió:

>
>
>
> TABLA1
> ACONTECIMIENTOSFECHA
> BAILE 12/03/2016
> GIMNASIA  12/03/2016
> RUNNING   13/03/2016
> STEP  15/03/2016
> ZUMBA 16/03/2016
> PILATES   17/03/2016
>
>
>
> TABLA2
> CUMPLEAÑOSFECHA1FECHA2FECHA3FECHA4
> Cliente112/03/201613/03/201614/03/201615/03/2016
>
>
> Hola,imaginemos que tengo estas dos tablas, y las quiero cruzar usando la
> FECHA como campo de cruce.Lo que quiero en concreto es cruzar los
> ACONTECIMIENTO de la TABLA1 con la FECHA1 de la TABLA2.Algo así:  merge
> (TABLA1, TABLA2, by.x = FECHA, by.y =FECHA1).
> A continuacion, los ACONTECIMIENTOS que no hayan cruzado la primera vez,
> que crucen ahora con la FECHA2. A continuacion, los ACONTECIMIENTOS que no
> hayan cruzado la primera ni la segunda vez, que crucen ahora con la
> FECHA3.  Así hasta que todos estén cruzados.Lo que hago ahora es ir paso
> por paso haciendo varios cruces consecutivos y luego uniendo los resultados
> con rbind. Pero es bastante tedioso. Me gustaría encontrar una forma de en
> un solo paso hacer todos los cruces (primero que cruce con FECHA1, sino,
> con FECHA2).
> SaludosJLC
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Matlab

2017-03-01 Por tema Carlos J. Gil Bellosta

Sí, claro: a mano y con dificultad.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 1 de marzo de 2017, 15:05, <jbetanco...@iscmc.cmw.sld.cu> escribió:

>
>
> Estimados
>
> ¿Es posible "traducir" scripts del Matlab a R?
>
>
> --
> Este mensaje le ha llegado mediante el servicio de correo electronico que
> ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
> Nacional de Salud. La persona que envia este correo asume el compromiso de
> usar el servicio a tales fines y cumplir con las regulaciones establecidas
>
> Infomed: http://www.sld.cu/
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] "IN" en data.table

2017-02-23 Por tema Carlos J. Gil Bellosta

%in%

El día 23 de febrero de 2017, 11:19, Mauricio Monsalvo
 escribió:
> Hola a todos.
> ¿Es posible filtrar casos en data.table por más de una categoría al mismo
> tiempo? Algo así como un IN o similar, dónde IN puede entenderse como
> "existe en":
> datos[Provincia IN c("CATAMARCA", "CHACO", "CORRIENTES"), FORM]
> O sea: una forma abreviada de hacer:
> datos[Provincia=="CATAMARCA"|Provincia=="CHACO"|Provincia=="CORRIENTES",
> FORM]
> Para filtrar a veces es un poco incómodo, pero para hacer un ifelse ya es
> bastante incómodo cuando son muchas las categorías que se incluyen en el
> filtro.
> Muchas gracias.
> Abrazo
>
>
> --
> Mauricio
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Comparar dos fechas

2017-02-22 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Usa & y no &&. Mira

?`&`

para los detalles. Más:

1) Te sobra el which. No es necesario.
2) Te recomendaría que transformases tu columna COFECHA a Date cuanto
antes. El código sería más simple.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 22 de febrero de 2017, 12:46, Andoni Alda
<aandonia...@gmail.com> escribió:
> Hola,
> soy bastante nuevo con R y estoy haciendo mis pruebas.
> Tengo un data.frame que contiene un campo de fecha, y me gustaria conseguir
> otro data.frame con los valores entre un rango de fechas.
> Ahora mismo estoy haciendolo de la siguiente manera:
>
> consulta[which(as.Date(consulta$COFECHA) >
> as.Date(input$dateRange[1])&(consulta$COFECHA) <
> as.Date(input$dateRange[2]) ), ]
>
> El problema es que solo consigo una fecha pero deberia haber mas
> Un saludo
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] media

2017-02-17 Por tema Carlos J. Gil Bellosta

?colMeans

El día 16 de febrero de 2017, 17:39, Carlos Ortega
 escribió:
> Hola,
>
> Una opción muy sencilla:
>
> mean_col <- apply(datos_semanas, 2, mean)
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 16 de febrero de 2017, 17:11,  escribió:
>
>>
>> Estimados
>>
>> Quisiera calcular las medias de cada semana de una sola vez con un script.
>> Apreciaría su ayuda
>>
>> sem01   sem02   sem03   sem04
>> 43  46  49  42
>> 67  57  74  87
>> 33  39  38  34
>> 82  55  59  44
>> 33  39  38  34
>>
>> saludos
>> José
>>
>>
>>
>> --
>> Este mensaje le ha llegado mediante el servicio de correo electronico que
>> ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
>> Nacional de Salud. La persona que envia este correo asume el compromiso de
>> usar el servicio a tales fines y cumplir con las regulaciones establecidas
>>
>> Infomed: http://www.sld.cu/
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] problemas con rBIND con distintos número de columnas

2017-02-15 Por tema Carlos J. Gil Bellosta

Si tu info es toda numérica y cada tabla tiene una clave primaria, siempre
puedes:

1) Hacer un melt por clave primaria de cada tabla para dejarla en formato
largo.
2) Apilar las tablas obtenidas con el do.call + rbind de toda la vida.
3) Hacer un cast para dejarla cuadrada de nuevo.

Así no tendrás problemas de ningún tipo.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El 15 de febrero de 2017, 15:59, Javier Valdes Cantallopts (DGA) <
javier.val...@mop.gov.cl> escribió:

> De esa forma me sigue entregando lo mismo, multiplica las variables por
> dos (*80 obs 26 variables*) debería ser (*80 obs 13 variables*).En
> concreto pega la información pero la costado, no hacia abajo.
>
> Solucionara el tema si le agrego dos columnas ficticias para que queden
> todas las bases con 13 variables?
>
> Saludos.
>
>
>
> [image: Descripción: FIRMA2]
>
>
>
> *De:* Carlos Ortega [mailto:c...@qualityexcellence.es]
> *Enviado el:* martes, 14 de febrero de 2017 16:57
>
> *Para:* Javier Valdes Cantallopts (DGA)
> *CC:* r-help-es@r-project.org
> *Asunto:* Re: problemas con rBIND con distintos número de columnas
>
>
>
> Hola,
>
>
>
> Recordaba que sí que se podía hacer con data.table
>
> Efectivamente...
>
>
>
>
>
> > library(data.table)
>
> > x_dt <- data.table( a= rnorm(10), b = rnorm(10))
>
> > y_dt <- data.table(  a= rnorm(10), b = rnorm(10), c = rnorm(10))
>
> >
>
> > l <- list(x_dt, y_dt)
>
> > rbindlist(l, fill = TRUE)
>
>   a   b   c
>
>  1:  0.40654327  1.57344885  NA
>
>  2:  0.08165417  0.15028804  NA
>
>  3:  0.37026494 -1.18386924  NA
>
>  4: -0.93010544  2.24961712  NA
>
>  5:  0.10843810  0.24032676  NA
>
>  6:  0.15378877 -0.78666170  NA
>
>  7:  1.03502437 -0.55456852  NA
>
>  8:  0.72717696 -0.08930502  NA
>
>  9:  2.33360032  0.85764087  NA
>
> 10: -0.13165594  1.90335605  NA
>
> 11: -0.58854517 -0.65231258 -2.08017763
>
> 12: -0.44410190 -0.60729636  0.75419119
>
> 13: -0.12112606 -2.95377291 -0.81158886
>
> 14: -0.16889601 -0.17042251  0.08904027
>
> 15:  0.09432534 -0.91301852  0.49149478
>
> 16: -1.19009027 -3.08695232  0.80642330
>
> 17:  0.50699299  0.32040260 -0.84056240
>
> 18: -0.89214614  0.33931926 -0.20491751
>
> 19:  0.55252772  2.09847775  0.28919268
>
> 20: -1.20012169 -1.17608943 -1.55813564
>
>
>
> 
>
> Saludos,
>
> Carlos Ortega
>
> www.qualityexcellence.es
>
>
>
>
>
> El 14 de febrero de 2017, 19:09, Javier Valdes Cantallopts (DGA) <
> javier.val...@mop.gov.cl> escribió:
>
> Hola Carlos:
>
> Tanto *rbind(base)*  como *rbind(data.table)* generan el mismo resultado *que
> no busco*.
>
> Que solución se le podría dar específicamente a la data de 11 columnas,
> que es la que me da problema.
>
> Saludos.
>
>
>
> [image: Descripción: FIRMA2]
>
>
>
> *De:* Carlos Ortega [mailto:c...@qualityexcellence.es]
> *Enviado el:* martes, 14 de febrero de 2017 14:21
> *Para:* Javier Valdes Cantallopts (DGA)
> *CC:* r-help-es@r-project.org
> *Asunto:* Re: problemas con rBIND con distintos número de columnas
>
>
>
> Hola Javier,
>
>
>
> Mientras que el "rbind()" que proporciona el paquete "base" en este caso
> te dará un error.
>
> El "rbind" que proporciona el paquete "data.table", creo que no lo da...
>
>
>
> Siempre puedes rellenar esos huecos con NAs en el data.frame al que le
> falte antes de juntarlas... y evitarte el trastorno.
>
>
>
> Saludos,
>
> Carlos Ortega
>
> www.qualityexcellence.es
>
>
>
> El 14 de febrero de 2017, 16:15, Javier Valdes Cantallopts (DGA) <
> javier.val...@mop.gov.cl> escribió:
>
> Hola a todos:
>
> Necesito pegar 4 bases de datos de N variables y N columnas, EL PROBLEMA
> ES QUE 3 *CONSTAN DE 13 COLUMNAS*, y LA CUARTA CON *11 COLUMNAS*.
>
> He *usado rbind y smartbind*, sin embargo el resultado no es el esperado,
> ya que coloca las columnas a un costado y no hacia abajo como debería
>
> Como resultado necesito algo como LO QUE PRESENTO ABAJO, *RELLENANDO LOS
> ESPACIOS VACIOS CON “NA”*
>
>
>
> 30/03/15 7:00
>
> 38
>
> 13.28
>
> 275.4431
>
> -1.667118
>
> 638.5
>
> -1.459
>
> 3.08
>
> 175.5
>
> -130
>
> -64.52
>
> *Na*
>
> *Na*
>
> 30/03/15 8:00
>
> 39
>
> 13.27
>
> 273.3796
>
> -0.9093614
>
> 638.5
>
> -1.386
>
> 4.099
>
> 151.6

Re: [R-es] Reintentos de una query en R

2017-02-14 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

En

https://www.datanalytics.com/2015/10/09/madrid-decide-propone-vota-etc/

tienes un ejemplo de una expresión try-catch para controlar ese tipo
de problemas.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 14 de febrero de 2017, 11:30, Sergio Castro
<castro.rodriguez.ser...@gmail.com> escribió:
> Buenos días,
>
> Estoy haciendo un script que se conecta a una base de datos externa y
> en la que crea diferentes tablas. Me estoy encontrando con que la
> conexion es bastante mala y muchas veces me falla a mitad de script
> por este motivo.
> Me gustaría meter esta sentencia de crear la tabla en algún tipo de
> try/catch o algo similar para que si falla, se reintente
> automaticamente un número configurable de veces.
> ¿Alguna idea? ¿Podrían ayudarme?
>
> Muchas gracias.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Convertir programa Matlab a R sacado de Threshold Models of Collective Behavior de Michèle Lai & Yann Poltera

2017-01-24 Por tema Carlos J. Gil Bellosta

gridsizes <- function(n){
  a <- 1:sqrt(n)
  a <- a[n %% a == 0]

  if(length(a) == 0)
stop("No se ha encontrado ninguna opción")

  a <- a[length(a)]
  c(a, n / a)
}

gridsizes(50)


gridsizes.alt <- function(n, c1, c2){
  a <- 1:(n/2)
  a <- a[n %% a == 0]
  a <- a[c1 %% a == 0]

  b <- n / a
  b <- b[c2 %% b == 0]

  if(length(b) == 0)
stop("No se ha encontrado ninguna opción")

  idx <- which.max(abs(b - n / b))

  c(n / b[idx], b[idx])
}


gridsizes.alt(100, 25, 4)


Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

2017-01-24 14:18 GMT+01:00 Sebastian Kruk <residuo.so...@gmail.com>:

> Estimados Usuarios-R:
>
> Estoy convirtiendo un programa en Matlab a R.
>
> El original lo saqué de:
>
> Lai, M., & Poltera, Y. (2009). Lecture with computer exercises: Modelling
> and simulating social systems with matlab. Tech. rep., Swiss Federal
> Institute of Technology (December 2009). 27.
>
> Ahora estoy convirtiendo la siguiente función:
>
> function sizes = gridsizes(N,varargin)
> % gridsizes(N) calculates the best factorization of N into two integers N1
> and
> % N2 such that : N1xN2 == N and N2-N1 -> min (optimal grid)
> % gridsizes(N,C1,C2) calculates the best factorization of N into two
> integers N1 and
> % N2 such that : N1xN2 == N and N2-N1 -> min, under the condition that N1
> % divides C1 and N2 divides C2 (optimal subgrids for an already existing
> % grid of size C1xC2   N)
> % gridsizes(N,C1,C2,1) returns [NaN;NaN] instead of an error message if the
> % fitting couldn't be found (used in the function N_from_d)
> sizes = NaN(2,1);
> s = sqrt(N);
> tol = 10ˆ(-12);
> N2= ceil(s);
> N1 = N/N2;
> if(nargin   3)
> C1 = varargin{1};
> C2 = varargin{2};
> while(rem(C1,N1) > tol || rem(C2,N2) > tol || rem(N1,round(N1)) > tol)
> N2 = N2+1;
> N1 = N/N2;
> if(N2 > N)
> if(nargin   4 && varargin{3} == 1)
> 45
> N1 = NaN;
> N2 = NaN;
> break;
> else
> error('Cannot find subgrid fitting to the given grid');
> end
> end
> end
> else
> while(rem(N1,round(N1)) > tol)
> N2 = N2+1;
> N1 = N/N2;
> end
> end
> sizes(1) = N1;
> sizes(2) = N2;
> end
>
> En R me quedó así:
>
> gridsizes <- function(N,...) {
> sizes <- matrix(NA,2,1)
> s = sqrt(N)
> tol = 10^(-12)
> N2 = ceiling(s)
> N1 = N/N2
> a = list(...)
> if(length(a)>=3) {
> C1 = a[[1]]
> C2 = a[[2]]
> while((C1%%N1) > tol || (C2%%N2) > tol || (N1 %%
> round(N1)) > tol) {
> N2 = N2+1
> N1 = N/N2
> if(N2 > N) {
> if(length(a) >= 4 && a[[3]] == 1) {
> N1 = NA
> N2 = NA
> }
> else {
> print("ERROR: no se puede hallar
> una subgrilla que entre en la grilla dada")
> }
> }
> }
> }
> else {
> while((N1%%round(N1)) > tol) {
> N2 = N2+1
> N1 = N/N2
> }
> }
> sizes[1] = N1
> sizes[2] = N2
> }
>
> En alguna parte se tranca y no sale del bucle pues si lo cancelo me
> aparece el error [1] "ERROR: no se puede hallar una subgrilla que entre en
> la grilla dada" repetido en forma indefinida.
>
> No me doy cuenta doy estoy errando.
>
> ¿Alguien se da cuenta?
>
> Saludos,
>
> Sebastián.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema con un xml demasiado Grande

2017-01-20 Por tema Carlos J. Gil Bellosta

Trocea o desiste.

Nunca vas a poder procesar 10GB de XML con una máquina de las
habituales. Si tienes 64GB de RAM o más, es otra historia.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 20 de enero de 2017, 10:59, Milagros Camacho Bellido
<mila.camachobell...@gmail.com> escribió:
> Hola, muy buenas,
>
> Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R
> el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo
> me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce
> alguna forma de cargar solo ese campo del xml en R sin cargar el xml
> completo? La salida seria un archivo .txt, donde cada fila fuera un artículo
> ó muchos archivos texto donde cada archivo fuera un artículo.
>
>
> Un saludo,
>
> Milagros Camacho
>
>
> ---
> El software de antivirus Avast ha analizado este correo electrónico en busca
> de virus.
> https://www.avast.com/antivirus
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] read.table con .csv separado por "|"

2017-01-19 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Abre el fichero con un editor de texto decente. Excel no es un editor
de texto decente. Notepad, tampoco. Elige uno y hazte amigo de él para
siempre. Con su concurso, sustituye todas (¡todas sin excepción!) las
comillas por nada.

Luego, guarda el fichero y

read.table("datos.csv", header = T, sep = "|")

funciona de maravilla.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El día 19 de enero de 2017, 0:22, Mauricio Monsalvo
<m.monsa...@gmail.com> escribió:
> Hola.
> Tengo un archivo que viene separado por "|" y a su vez con (casi) todos los
> campos entre comillas ("..."), incluso los valores numéricos. Adjunto
> algunos datos de prueba. El error que da es que no encuentra 14 elementos en
> las filas (son 15 variables).
> Probé algunas variantes y traté de orientarme por la ayuda y Stack
> (http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no
> encontré mejor solución que:
> 1) Abrir el archivo con Excel.
> 2) Reemplazar | por ;
> 3) Reemplazar " por [nada];
> 4) Abrirlo con:
> datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "",
> encoding = "UTF-8")
> y digamos que funciona, salvo que la primera variable contiene un " al
> inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO
> CRITICO", NIÑO NEONATO", "etc).-
> ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos entre
> "") o bien a levantarlo luego del replace sin esas incómodas " al inicio de
> la primera variable y al final de la última?
> Muchas gracias.
> Saludos!
>
> --
> Mauricio
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Leer archivos en formato JSON

2017-01-16 Por tema Carlos J. Gil Bellosta

Busca "json" en

https://cran.r-project.org/web/packages/available_packages_by_name.html

Google suele ser más rápido que la lista para estos menesteres.

El día 16 de enero de 2017, 17:47, Horacio  escribió:
> Hola, disculpen la pregunta si parece trivial, pero hay algún paquete
> o forma de leer archivos en formato "json"(1)?
>
> (1) JSON, acrónimo de JavaScript Object Notation, es un formato de
> texto ligero para el intercambio de datos. JSON es un subconjunto de
> la notación literal de objetos de JavaScript aunque hoy, debido a su
> amplia adopción como alternativa a XML, se considera un formato de
> lenguaje independiente.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Error K-MEDIAS, paquete NbClust windows 10, 64 bits

2017-01-16 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si R crea la matriz de distancias necesitarás, como poco, 29*29*8 MB
de RAM. Puede ser mucho para tu equipo. Trata de correr el código
usando subconjuntos de datos (1%, 5%, 10%, etc.) para ver desde fuera
cuánta RAM estás consumiendo.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 16 de enero de 2017, 16:32, Cesar Vanegas Castro
<ing.cesarvane...@hotmail.com> escribió:
> Buenos dias, desde hace algunos dias estoy realizando un trabajo,mi 
> computadora es una DELL, windows 10 64 bits, 8G de RAM y disco de estado 
> solido, estoy procesando 29000 filas y 23 columnas, mi codigo es este:
>
> nb <- NbClust(datos.scaled, distance = "euclidean", min.nc = 2,
> #max.nc = 10, method = "complete", index ="all")
> .
>
> y mi error es este:
>
> Error: cannot allocate vector of size 2.0 Gb
>
>
> Gracias
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] AYUDA TukeyHSD

2017-01-10 Por tema Carlos J. Gil Bellosta

Primero, deberías hacer

TukeyHSD(ANOVAGalMan3, "Sample*`Purification-step`",ordered = TRUE)

Segundo, ni eso te va a funcionar. Cambia el nombre de tus columnas para
que no tengan guiones ni tengas que usar comillas.

Arrastrar nombres con caracteres inválidos es garantía de problemas.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 10 de enero de 2017, 19:34, Pilar Vilaro <pilarvil...@gmail.com>
escribió:

> Hola,
> estoy intentando hacer un Tukey post test y no me lo permite.
> Hice el anova con aov sin problemas, pero al hacer el Tukey, me dice:
>
> > TukeyHSD(ANOVAGalMan3,Sample*`Purification-step`,ordered = TRUE)Error
> in `[.data.frame`(mf, mf.cols[[i]]) : undefined columns selected
>
>
> aclaro que ANOVAGalMan3 es el resultado de anova.
>
> la tabla origen tiene la estructura:
>
> Sample Purification-step Total-sugar-content Total-protein-content
> G-M-ratio
> Prosopis affinis Yo 63,5 4,2 1,4
>
> y tiene algunos datos faltantes que aparecen como NA
>
> alguno puede ayudarme?
> muchas gracias saludos
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] que tal comunidad, una pregunta del paquete data.table

2017-01-06 Por tema Carlos J. Gil Bellosta

Lo que quieres es un sort y, luego, un tail. Abundando en el ejemplo de
Carlos Ortega,

library(data.table)
set.seed(22)

tmp <- data.table(x = rnorm(100), y = rnorm(100), z = sample(1:5, 100,
replace = TRUE))

setkeyv(tmp, c("z", "y"))
tmp[, tail(.SD, 1), by=z]

Así puedes sacar los N mayores, etc.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El 6 de enero de 2017, 4:38, eric <ericconchamu...@gmail.com> escribió:

> si se tiene un data.table (DT), supongamos de 100 filas por 3 columnas de
> datos numericos, como puedo hacer para obtener el correspondiente valor de
> la columna 1 si busco, por ejemplo, el maximo de la columna 2 agrupado por
> la columna 3 ?
>
> para buscar el maximo de la columna 2 escribo.
>
> DT[ , max(c2), by=c3 ]
>
> muchas gracias,
>
> saludos, eric.
>
>
>
>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city
> standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
> lectores de correo.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Dos pequeños códigos casi idénticos y sólo funciona el primero

2016-11-26 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Respondo debajo:

El 25 de noviembre de 2016, 10:21, Olivier Nuñez <onu...@unex.es> escribió:

> Creo que el "by" sobra, o me perdí algo?


Bueno, en el código original había un

all(envio == T)

dentro de un grupo "by". Entiendo que la lógica que seguía aplicaba solo si
todos los envíos por caso/empresa fuesen T. En el ejemplo mostrado daba
igual (¿accidente de los datos?); pero en el general, entiendo, no.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


>
> DT.new=DT[!(envio=="TRUE" & coche=="B"),]
> DT.new[(envio=="FALSE" & coche=="B"),coche:="A"]
> DT.new
>caso empresa coche envio
> 1:1  E1 A  TRUE
> 2:1  E1 U  TRUE
> 3:2  E2     W FALSE
> 4:2  E2 A FALSE
>
>
> Un saludo. Olivier
>
> - Mensaje original -
> De: "Carlos J. Gil Bellosta" <c...@datanalytics.com>
> Para: "Francisco Javier" <iterado...@hotmail.com>
> CC: r-help-es@r-project.org
> Enviados: Jueves, 24 de Noviembre 2016 16:44:16
> Asunto: Re: [R-es]  Dos pequeños códigos casi idénticos y sólo
> funciona el primero
>
> Hola, ¿qué tal?
>
> ¿Has pensado en la posibilidad de que tu código (el que funciona) funcione
> solo "de casualidad" y porque tus datos son así y no de otra manera? Tengo
> la sensación de que sí.
>
> La lógica es endiablada, y creo que se entiende mejor (y obtienes el mismo
> resultado) si haces:
>
> DT[, all.true := all(envio == "TRUE"), by = list(caso, empresa)]
> DT <- DT[!(all.true & coche == "B"),]
> DT[, all.true := NULL]
> DT$coche[DT$coche == "B"] <- "A"
> DT
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El 24 de noviembre de 2016, 16:21, Francisco Javier <
> iterado...@hotmail.com>
> escribió:
>
> > Buenas tardes a todos,
> >
> > He adaptado una pregunta realizada en otro foro respecto de un caso que
> me
> > interesa resolver. Sea el data.table:
> >
> > DT <- data.table(caso = rep(1:2, c(3, 2)),  empresa = factor(rep(c("E1",
> > "E2"), c(3, 2))),
> >   coche = factor(c('A', 'B', 'U', 'W', 'B')),  envio = factor(rep(c(T,
> F),
> > c(3, 2
> >
> >
> > En el siguiente codigo, segun la dupla (caso, empresa), se eliminan las
> > filas coche="B" si envio=T, y se cambia "B" por "A" si envio = F.
> >
> > DTnew <- DT[,##  CODIGO QUE SÍ FUNCIONA
> >if (all(envio == T))  list(coche = coche[which(coche != "B")])
> >else  list(coche),
> > by = list(caso, empresa)][, coche :=  as.factor(ifelse(coche == "B", "A",
> > as.character(coche))) ]
> >
> > caso   empresa coche
> > 1:   1  E1A
> > 2:   1  E1U
> > 3:   2  E2   W
> > 4:   2  E2A
> >
> >
> > Sin embargo, el siguiente código (casi identico) NO funciona:
> >
> > DTnew <- DT[,
> >if (all(envio == T))  list(coche = coche[which(coche != "B")])
> >else  list(coche = as.factor(ifelse(coche == "B", "A",
> > as.character(coche,
> > by = list(caso, empresa)]
> >
> > caso   empresa coche
> > 1:   1  E1A
> > 2:   1  E1U
> > 3:   2  E2B
> > 4:   2  E2A
> >
> >
> > ¿Alguién podría decirme como modificarlo para que sí funcione? Muchas
> > gracias por cualquier ayuda.
> >
> > [[alternative HTML version deleted]]
> >
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] charater a numeric

2016-11-22 Por tema Carlos J. Gil Bellosta

Tu problema es la coma. Cámbiala a punto y luego, as.numeric.

El 22/11/2016 8:08 p. m.,  escribió:

> Estimado Santiago Repetto
>
> Sus datos están mal.
>
> "#¡NULO!"
>
> En R es NULL, pero al importar o escribir los datos, el mismo R debería
> colocarlos en nulo, también usted puede colocar valores en nulo, pero creo
> que no es el caso.
>
> Luego con as.numeric(datos…) debería funcionar.
>
> Javier Rubén Marcuzzi
>
> De: Santiago Repetto
> Enviado: martes, 22 de noviembre de 2016 12:07
> Para: r-help-es@r-project.org
> Asunto: [R-es] charater a numeric
>
> Hola!!
> Soy novato en esto del R. Consulto por que ya estoy agotando los recursos
> para resolver un problema con tutoriales, consultas que se encuentran en
> google, etc. Si bien el problema parece ser simple no le encuentro la
> vuelta.
>
> Tengo un data.frame que armé importando un csv. Algunas de las columnas son
> mayoritariamente compuestas por valores números pero class character ya que
> al contener valores no numéricos ("#¡NULO!" por ejemplo) los importa como
> character. Quiero convertirlas justamente a un vector numeric (o mejor aun
> dentro del mismo data.frame que sean numeric) para poder operar con ellas
> (los valores que no sean números deberían quedar como NA).
>
> Probé con
> <-as.numeric(as.character(SS))
> pero me devuelve valores NA.
>
> También probé con
> SS1<- type.convert(SS, na.strings = "NA", as.is = FALSE, dec = ",",
> numerals = c("allow.loss", "warn.loss", "no.loss")) y luego con as.numeric
> pero me devuelve los números de ordenación de niveles del factor (creo)
>
> Muy agradecido de antemano por cualquier sugerencia, comando o solución (o
> si estoy cometiendo algún problema lógico en la propia formulación del
> problema).
> Este sería mas o menos el contenido de mis datos (como vector).
> Saludos!
> Santiago
>
> > SS
>  [1] "137155,00" "134714,00" "136184,00" "#¡NULO!"   "139683,00" "13827,00"
>  [7] "139450,00" "#¡NULO!"   "134462,00" "136058,00" "132818,00" "30020,00"
> [13] "29283,00"  "33885,00"  "30885,00"  "34390,00"  "#¡NULO!"   "35104,00"
> [19] "32154,00"  "39554,00"  "36246,00"  "7226,00"   "40595,00"  "36674,00"
> [25] "46877,00"  "45278,00"  "47273,00"  "44755,00"  "42184,00"  "38457,00"
> [31] "41808,00"  "39004,00"  "#¡NULO!"   "#¡NULO!"   "#¡NULO!"   "#¡NULO!"
> [37] "2351,00"   "2982,00"   "2080,00"   "2331,00"   "2562,00"   "2479,00"
>
> > data.class(SS)
> [1] "character"
>
> > as.numeric(as.character(SS))
>  [1] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
> NA NA
> [26] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] RV: pregunta

2016-10-27 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

¿No te vale epiDisplay
<https://cran.r-project.org/web/packages/epiDisplay/index.html>?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 27 de octubre de 2016, 11:56, Dr. José A. Betancourt Bethencourt <
josebetancourt@infomed.sld.cu> escribió:

>
>
>
>
> De: Dr. José A. Betancourt Bethencourt [mailto:jbetanco...@iscmc.cmw.
> sld.cu]
>
> Enviado el: jueves, 27 de octubre de 2016 05:56
> Para: 'r-help-es@r-project.org' <r-help-es@r-project.org>
> Asunto: pregunta
>
>
>
> Estimados, el paquete EPICALC ya no funciona, ¿existe alguna manera de
> utilizarlo sin tener que regresar a una vieja versión de r? Es que para la
> docencia es muy útil
>
> Saludos
>
> José
>
>
>
> --
> Este mensaje le ha llegado mediante el servicio de correo electronico que
> ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema
> Nacional de Salud. La persona que envia este correo asume el compromiso de
> usar el servicio a tales fines y cumplir con las regulaciones establecidas
>
> Infomed: http://www.sld.cu/
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Alto rendimiento

2016-10-11 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Spark correría en tantos hilos como estuviese configurado a utilizar (con
límite en los existentes). La promesa de sparklyr es que se trata de una
mera interfaz que delega el procesamiento de datos en Spark. Spark
paralelizaría (que de eso trata).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El 11 de octubre de 2016, 15:55, <javier.ruben.marcu...@gmail.com> escribió:

> Estimados
>
> En el sitio de https://www.rstudio.com/  hay un aviso sobre
> http://spark.rstudio.com/index.html ( sparklyr ).
>
> Microsoft publico un artículo donde comparan el R Server que está dentro
> de SQL server (o por separado, depende un poco), o el Microsoft R, junto
> con algunas librerías que se pueden compilar y obtener lo mismo en Ubuntu.
>
> Supongamos que tengo el dinero como para comprar por ejemplo
> http://www.intel.la/content/www/xl/es/processors/xeon/
> xeon-processor-e7-family.html uno de estos procesadores con 36 núcleos.
>
> Supongamos que tengo aún más dinero y puedo comprar 4 computadoras y
> colocarlas de tal forma que puedan trabajar en conjunto.
>
> Ahora mi pregunta, spark (sparklyr) utiliza mis cuatro computadoras pero
> ¿un solo núcleo o los 36? (java usa solo un núcleo)
>
> La parte de Microsoft utiliza los 36 procesadores, pero las librerías que
> están en los repositorios de Microsoft (no las de CRAN) ¿están optimizadas
> para los 36 procesadores?
>
> O solo hay partes en spark como mlib o lo específico de R Microsoft
> optimizado, que puedan utilizar todos los núcleos y/o procesadores. Por
> ejemplo MCMCglmm ¿tiene beneficios en cualquiera de estas tecnologías o
> solo utiliza lo mismo que puede procesar en una portátil?
>
> O si compro los cuatro equipos con 36 núcleos, instalo la versión de
> Microsoft junto con sparklyr y: ¿tengo una capacidad de cálculo
> impresionante, o esa capacidad es solo en sectores de R siendo el resto
> procesado en forma tradicional?
>
> ¿Hay comentarios al respecto desde la experiencia de alguno del grupo?
>
> Javier Rubén Marcuzzi
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Concatenación de tablas

2016-09-26 Por tema Carlos J. Gil Bellosta

?merge

El 26 de septiembre de 2016, 22:09, Cesar Lopez 
escribió:

> Buenas Tardes,
>
>
> Les escribo para solicitarles una ayuda dado que tengo 2 tablas, una con
> los campos:
>
>
> cedula | nombre | direccion
>
>
> y la otra con la tabla:
>
>
> cedula | barrio | municipio
>
>
> Lo que necesito es hacer una comparación del campo cedula de las dos
> tablas y si son iguales, agregarle los campos barrio y municipio de la
> segunda tabla a la fila correspondiente de esa cedula de la primera tabla
> al lado de direccion.
>
>
> Agradeciendo todo su apoyo,
>
>
> CESAR AUGUSTO LOPEZ
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Variable Progresiva

2016-09-26 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

He leído en este hilo la respuesta correcta a la pregunta equivocada.
Realmente, no quieres crear variables con nombres generados con un
subíndice; quieres una lista.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 26 de septiembre de 2016, 16:40, Rafael Saturno <
rafael_satu...@hotmail.com> escribió:

> Una duda, si fuese a leer 3 archivos csv que se llamar archivo 1, archivo
> 2 y archivo 3 también se podría usar? gracias
>
>
> 
> De: Isidro Hidalgo Arellano <ihida...@jccm.es>
> Enviado: lunes, 26 de septiembre de 2016 07:48 a.m.
> Para: 'Rafael Saturno'; 'R'
> Asunto: RE: [R-es] Variable Progresiva
>
> Lo que quieres hacer se hace con la función "assign()". En tu ejemplo:
> assign(paste("k", i, sep = ""), sum(1:i))
> Un saludo
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo
> http://www.castillalamancha.es/
> Inicio | Gobierno de Castilla-La Mancha<http://www.castillalamancha.es/>
> www.castillalamancha.es
> Web oficial del gobierno autonómico de Castilla-La Mancha con información
> sobre actividad administrativa, economía, educación, sanidad, servicios
> sociales, sede ...
>
>
>
>
>
>
> -Mensaje original-
> De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de Rafael
> Saturno
> Enviado el: lunes, 26 de septiembre de 2016 1:43
> Para: R <r-help-es@r-project.org>
> Asunto: [R-es] Variable Progresiva
>
> Hola Comunidad,
>
>
> Tengo una duda,
>
>
> Queria que en un For si fuese ejecutando un proceso desde 1 hasta 5 por
> poner un ejemplo , y que el resultado se fuese guardando en variables que
> se
> llamar Ki, es decir k1, k2, k3...
>
>
> Un ejemplo de como crei que funcionaria y no lo hizo xD
>
>
> for (i in 1:3) {
>
> paste("k", i, sep = "") <- sum(1:i)
>
> }
>
> Esperaba se crearan las variables k1 = 1, k2= 3 y k3 = 6
>
>
> Gracias
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] distribuciones multimodales

2016-09-22 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

En

https://cran.r-project.org/web/views/Cluster.html

tienes una discusión de paquetes que te pueden ser útiles. Te interesan los
que tienen que ver con mixturas de distribuciones normales, que es lo que
parece que tienes entre manos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 22 de septiembre de 2016, 18:01, Carlos Fernández-Delgado <
ba1fe...@uco.es> escribió:

> Estimados amigos, ¿hay algún paquete que me ayude a diferenciar las
> distribuciones (normales) existentes en una variable multimodal como la que
> os envío en archivo adjunto?. Esta distribución se trata de diámetro de
> óvulos intraováricos de un pez. Me gustaría extraer cada una de las
> distribuciones que la distribución global muestra.
> Muchas gracias
> Carlos
> **
> Dr. Carlos Fernández-Delgado
> Grupo de Investigación "Aphanius"
> Departamento de Zoología
> Edificio Charles Darwin 3ª pta.
> Campus Universitario de Rabanales
> Universidad de Córdoba
> 14071 Córdoba (Spain)
> Tlfno./Fax: +34 957 218 605
> Móvil: 616486912
> correo-e: carlos.fdelg...@uco.es
> http://www.uco.es/aphanius
> *
> Libro sobre los peces del Guadalquivir:
> 1.- Alta resolución, sigue este enlace:
> http://www.uco.es/aphanius/includes/descarga.php?id=16
> 2.- Baja resolución, sigue este otro:
> http://www.sibic.org/ictio-blog/Entradas/2014/7/20_Nuevo_
> libro_sobre_los_peces_dulceacuicolas_del_rio_Guadalviquir.html
>
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Carlos J. Gil Bellosta

Sí, la primera reunión de la temporada será el 8 de este mes.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 3 de septiembre de 2016, 23:52, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Muchas gracias a todos!
>
> Pues si, Eric, R a veces me vuelve loco, tiene una lógica muy particular.
> Miraré el libro, que lattice no lo he usado nunca.
>
> Gracias Carlos, con tu ejemplo creo que he conseguido hacer el grafico que
> queria.
>
> Muchas gracias! Os debo una caña un dia de estos - a los madrileños- en
> las reuniones de Medialab. Este año os seguireis reuniendo en Medialab?
>
> Un abrazo!
> Prueba algo así:
>
> library(ggplot2)
>
> datos <- read.table("Downloads/pec.csv", header = T, sep = ";", dec = ",")
> datos$Miles <- as.numeric(gsub("\\.", "", as.character(datos$Miles)))
>
> datos$hora <- strptime(datos$hora, format = "%H:%M")
>
> ggplot(datos, aes(x = hora, y = Miles)) + geom_line() +
>   scale_x_datetime(date_breaks = "15 mins", date_labels = "%H:%M")
>
>
> Además, en aes no hay que hacer referencia a la tabla. Expresiones como
>
> ggplot(datos, aes(x = datos$hora, y = datos$Miles)) + ...
>
> son innecesariamente redundantes.
>
> Salud,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El 3 de septiembre de 2016, 18:14, Ruben Tobalina Ramirez <
> lagrimaescr...@gmail.com> escribió:
>
>> Buenas tardes!
>>
>> uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
>> responder antes, aunque esta madrugada antes de ir a currar los he probado.
>> Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
>> y va perfecto. Luego pruebo con mis datos - haciendo los cambios
>> correspondientes - y R me fusila a errores:D
>>
>> De hecho el segundo gráfico - el del share - no sale con los
>> consiguientes errores -dependiendo la la variable que use (Share o miles):
>>
>>
>>
>> *Error: Discrete value supplied to continuous scalegeom_path: Each group
>> consists of only one observation. Do you need to adjust the groupaesthetic?*
>>
>> Modifique el código tal que así:
>>
>> ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
>>   geom_bar(stat="identity", width = 0.8, fill="gray") +
>>   theme(panel.background = element_rect(fill = "white")) +
>>   scale_y_continuous(limits=c(0,1500))
>> ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
>>   geom_line()+
>>   theme(panel.background = element_rect(fill = "white")) +
>>   scale_y_continuous(limits=c(0,1500))
>>
>> library(gridExtra)
>> grid.arrange(ggbar, ggline, nrow=2, ncol=1)
>>
>> No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
>> que esta hecho a propósito, y por eso supongo que me da el primer error,
>> pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
>> [image: Imágenes integradas 2]
>>
>> Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas
>> en el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo
>> así?
>>
>> Un saludo!
>>
>>
>> El 3 de septiembre de 2016, 0:12, Carlos Ortega <c...@qualityexcellence.es
>> > escribió:
>>
>>> Y bueno, algo más bonito sí que queda con ggplot...
>>>
>>> #---
>>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>>
>>> library(ggplot2)
>>> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
>>> lab_x <- as.vector(datIn$hora[ lab_x_idx])
>>> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>>>  geom_bar(stat = "identity") +
>>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>>> datIn$hora[nrow(datIn)], sep = "") ) +
>>>  ylab("Frecuencia") +
>>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>>>  theme_minimal()
>>> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>>>  geom_line() +
>>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>>> datIn$hora[nrow(datIn)], sep = "") ) +
>>>  ylab("Share") +
>>>  ylim(0, max(datIn$Share)*1.10) +
>>>  scale_x_continuous( breaks = lab_x_id

Re: [R-es] Pivot tables con data.table

2016-09-03 Por tema Carlos J. Gil Bellosta

reshape2 + dcast

El día 3 de septiembre de 2016, 19:23, Fernando Macedo
 escribió:
> Buenas, estoy intentando hacer una especie de pivot tables con data.table
> pero no logro que me salga.
>
> Este código refleja un poco lo que quiero
>
>
> library(data.table)
> set.seed(1234)
> DT <- data.table(x=rep(c(1,2,3),each=30),
>  y=letters[sample(1:3,30,replace = T,)],
>  v=sample(1:100,30))
> out <- DT[,list(N=.N),by=list(x,y)]
>
> Eso genera una salida como esta:
>
>  x y  N
> 1: 1 a  8
> 2: 1 b 10
> 3: 1 c 12
> 4: 2 a  8
> 5: 2 b 10
> 6: 2 c 12
> 7: 3 a  8
> 8: 3 b 10
> 9: 3 c 12
>
>
> Que esta bien, pero lo que me interesa a mi es sacar una tabla con la
> siguiente estructura:
>
> x  a b c
> 1 8 10 12
> 2 8 10 12
>  ...
>
> y así. Porque después quiero hacer frecuencias y me resulta más fácil para
> armar columnas de frecuencias seguidas de esas y queda mejor para presentar
> los datos también.
>
> La verdad que he buscado pero no logro dar con la tecla de hacerlo en un
> solo paso en data.table, o de repente no la hay.
>
>  Desde ya agradezco su ayuda.
> Saludos!
>
> --
> Fernando Macedo
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con gráfico típico de histograma más linea

2016-09-03 Por tema Carlos J. Gil Bellosta

Prueba algo así:

library(ggplot2)

datos <- read.table("Downloads/pec.csv", header = T, sep = ";", dec = ",")
datos$Miles <- as.numeric(gsub("\\.", "", as.character(datos$Miles)))

datos$hora <- strptime(datos$hora, format = "%H:%M")

ggplot(datos, aes(x = hora, y = Miles)) + geom_line() +
  scale_x_datetime(date_breaks = "15 mins", date_labels = "%H:%M")


Además, en aes no hay que hacer referencia a la tabla. Expresiones como

ggplot(datos, aes(x = datos$hora, y = datos$Miles)) + ...

son innecesariamente redundantes.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 3 de septiembre de 2016, 18:14, Ruben Tobalina Ramirez <
lagrimaescr...@gmail.com> escribió:

> Buenas tardes!
>
> uau! Muchas gracias!! He estado trabajando esta mañana y no he podido
> responder antes, aunque esta madrugada antes de ir a currar los he probado.
> Es sorprende como R saca de quicio, probé tus scripts con el csv que mandé
> y va perfecto. Luego pruebo con mis datos - haciendo los cambios
> correspondientes - y R me fusila a errores:D
>
> De hecho el segundo gráfico - el del share - no sale con los consiguientes
> errores -dependiendo la la variable que use (Share o miles):
>
>
>
> *Error: Discrete value supplied to continuous scalegeom_path: Each group
> consists of only one observation. Do you need to adjust the groupaesthetic?*
>
> Modifique el código tal que así:
>
> ggbar<-ggplot(ft, aes(x=ft$hora, y=ft$frec)) +
>   geom_bar(stat="identity", width = 0.8, fill="gray") +
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
> ggline<-ggplot(ft, aes(x=ft$hora, y=ft$Miles)) +
>   geom_line()+
>   theme(panel.background = element_rect(fill = "white")) +
>   scale_y_continuous(limits=c(0,1500))
>
> library(gridExtra)
> grid.arrange(ggbar, ggline, nrow=2, ncol=1)
>
> No entendí muy bien por qué no indicabas en el eje x las horas. Entiendo
> que esta hecho a propósito, y por eso supongo que me da el primer error,
> pero no entiendo porque. Gráficando por ejemplo los tweets no hay problema:
> [image: Imágenes integradas 2]
>
> Por cierto, hay alguna forma que no sea poniendo "a mano" como indicabas
> en el correo, de poner los minutos más claro, a lo mejor de 5 en 5, o algo
> así?
>
> Un saludo!
>
>
> El 3 de septiembre de 2016, 0:12, Carlos Ortega <c...@qualityexcellence.es>
> escribió:
>
>> Y bueno, algo más bonito sí que queda con ggplot...
>>
>> #---
>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>
>> library(ggplot2)
>> lab_x_idx <- c(1, round(nrow(datIn)/2, 0), nrow(datIn))
>> lab_x <- as.vector(datIn$hora[ lab_x_idx])
>> fre_gg <- ggplot( datIn, aes( x = 1:nrow(datIn),   y = frec)) +
>>  geom_bar(stat = "identity") +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Frecuencia") +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x ) +
>>  theme_minimal()
>> sha_gg <- ggplot( datIn , aes(x = 1:nrow(datIn), y = Share)) +
>>  geom_line() +
>>  xlab(paste("Rango horas: ", datIn$hora[1], "-",
>> datIn$hora[nrow(datIn)], sep = "") ) +
>>  ylab("Share") +
>>  ylim(0, max(datIn$Share)*1.10) +
>>  scale_x_continuous( breaks = lab_x_idx, labels = lab_x )
>> +
>>  theme_minimal()
>> library(gridExtra)
>> grid.arrange(fre_gg, sha_gg, nrow=2, ncol=1)
>>
>> #---
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> El 2 de septiembre de 2016, 21:47, Carlos Ortega <
>> c...@qualityexcellence.es> escribió:
>>
>>> Hola,
>>>
>>> Aproximación muy sencillita...con gráficos "base":
>>>
>>> #-
>>>
>>> datIn <- read.csv("pec.csv", header = TRUE, sep = ";", dec = ",")
>>>
>>> par(mfrow = c(2,1))
>>> barplot(
>>>   datIn$frec
>>>  ,las = 1
>>>  ,col = "green"
>>>  ,cex.axis = 0.7, col.axis = "red", font.axis = 2
>>>  ,main = "Frequency"
>>> )
>>> box()
>>> plot(
&

Re: [R-es] Descomposición de series de tiempo

2016-08-05 Por tema Carlos J. Gil Bellosta

¿No puedes convertir tu objeto xts en uno de tipo ts para la descomposición?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 5 de agosto de 2016, 20:36, Carlos Aguero <dev.agu...@gmail.com>
escribió:

> Saludos a todos, quiera saber si alguno conoce alguna manera de realizar
> una descomposición como la mostrada en la imagen pero utilizando el paquete
> *xts* en lugar del paquete *ts* [image: Imágenes integradas 2]
> De antemano muchas gracias por cualquier información.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problemas con ggmap

2016-08-01 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Copio de 
http://stackoverflow.com/questions/30018098/how-to-convert-utm-coordinates-to-lat-and-long-in-r
(que es fácil de ubicar buscando en Google algo así como "r utm to lat
lon"):

library(rgdal)
sputm <- SpatialPoints(randompoints, proj4string=CRS("+proj=utm
+zone=??? +datum=WGS84")
spgeo <- spTransform(sputm, CRS("+proj=longlat +datum=WGS84"))

Necesitas saber cuál es la zona de UTM de tus datos (para reemplazar
los ???). Casi seguro que es la 30.

Puedes añadir texto con ggmap usando geom_text.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 2 de agosto de 2016, 4:24, Javier Gómez Gonzalez
<zaraga...@gmail.com> escribió:
> Hola a todos:
>
>
>
> Estoy haciendo un estudio de la contaminación atmosférica en Granada con el
> paquete openair y quiero hacer un mapa de situación con ggmap. Tengo dos
> problemas, el primero es que me han pasado las coordenadas de las
> estaciones de medida y de los complejos industriales en UTM  y la pregunta
> es si es posible emplear coordenadas UTM en ggmap y si no lo es, si hay
> algún paquete para convertirlas las coordenadas UTM a longitud y latitud.
>
> El segundo problema es que quiero poner en el mapa a cada estación de
> medida y complejo industrial su nombre y no tengo ni idea de como se hace.
>
>
>
> Muchas gracias
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Muestrear de una normal multivariante.-

2016-07-17 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Si son valores arbitrarios los que quieres colocar en Sigma_UZ, hazlos
más pequeños (p.e., dividiéndolos por 10).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 17 de julio de 2016, 23:15, Freddy Omar López Quintero
<freddy.lopez.quint...@gmail.com> escribió:
> ¡Hola a todos!
>
> Estoy intentando muestrear de una normal multivariante donde hay dos grupos
> de variables que deben tener una relación "manipulable" entre sí pero
> ignoro cómo hacerlo.
>
> Les cuento, he intentado lo siguiente:
>
> # covarianzas del primer grupo de variables:
> Sigma_U <- matrix(c(.25, .2, .2, .25), ncol=2)
>
> # covarianzas del segundo grupo de variables:
> Sigma_W <- diag(2)
>
> # covarianzas _arbitrarias_ entre los dos grupos de variables
> Sigma_UZ <- matrix(rnorm(4), nrow=2)
>
> # consolidación de las covarianzas anteriores:
> Sigma<-rbind(
> cbind(Sigma_U, Sigma_UZ),
> cbind(t(Sigma_UZ), Sigma_W)
> )
>
> # muestreo:
> MASS::mvrnorm(1, mu=rep(0, 4), Sigma=Sigma)
>
> De donde recibo:
>
> Error in mvrnorm(1, mu = rep(0, 4), Sigma = Sigma) :
>   'Sigma' is not positive definite
>
>
> El error (creo yo) está la generación de esas covarianzas arbitrarias para
> que esta matriz consolidada, Sigma, sea definida positiva. Mi necesidad es
> que las matrices Sigma_U y Sigma_W sean las que he definido pero saber o
> poder ubicar las covarianzas de Sigma_UZ para que no arroje error.
>
> ¿Alguien sabe cómo podría hacer?¿Qué pasos debería seguir?
>
> ¡Gracias!
>
> --
> «...my role is to be on the bottom of things.»
>
> Donald Knuth
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problemas con paquete rgl

2016-07-17 Por tema Carlos J. Gil Bellosta

Te faltan librerías en el sistema operativo. Trata de instalar X11 en tu
Mac. Creo que contiene la dependencia que necesitas.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 17 de julio de 2016, 15:21, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimada Leslie Vargas Vásquez
>
> Yo supe tener problemas con rgl, no en mac pero si en Linux, básicamente
> intenta instalar nuevamente, si no funciona intenta compilar desde el
> código fuente, para eso tendrás que instalar las herramientas de desarrollo
> de mac, cuándo yo usaba ese sistema en el DVD del sistema operativo estaba
> todo.
>
> Lo que me paso es que rgl tiene unas dependencias que no siempre están.
>
> Javier Rubén Marcuzzi
>
> De: Leslie Vargas Vásquez
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Calcular media cada x tramos

2016-07-15 Por tema Carlos J. Gil Bellosta

library(plyr)

tmp <- curvas
tmp$grupo <- rep(rep(1:18, each = 10), times = numero_de_curvas)
ddply(tmp, .(curva, grupo), media = mean(valor))

supuesto que se den ciertas condiciones (como que todas las curvas tienen
180 puntos).

El 15 de julio de 2016, 14:31, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas,
>
> Estoy intentando caracterizar una curva de 180 puntos y sacar su vector de
> caracteristica:
>
> Punto de inicio,
> Máximo
> Minimo
> 
>
> Para ello tengo un dataframe con las distintas curvas, de la forma
> siguiente:
>
>
> segundos   valor curva
> 1 1701
> 2 175 1
> ..
> 180  125 1
> 1  190 2
> 2   1932
> .
>
>
> Como puedo hacer para sacar el promedio de cada 10 segundos de la curva???
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Distribuciones de probabilidad

2016-07-11 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

La respuesta breve es no.

Para los usos más habituales, sin embargo, bastaría con un mean(rXXX(1e5,
...)). Aunque cuidado
<https://www.datanalytics.com/2016/05/31/el-extrano-caso-de-la-media-empirica-menguante/>
.

Si quieres la respuesta de libro, tendrás que consultar o deducir esos
estadísticos. Y tendrás que tener cuidado con la parametrización particular
que hace R cuando no hay una supercanónica.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 11 de julio de 2016, 16:39, Rafael Saturno <rafael_satu...@hotmail.com>
escribió:

> Hola Comunidad,
> Tenia al siguiente duda
> ¿hay alguna forma de que R me de la Esperanza y Varianza de una
> distribución según sus parámetros?
> es decir, si tengo una weibull de parámetros "X" y "Y" para la esperanza
> hay una formula, pero me gustaría saber si hay una función en R que le diga
> algo como
> Esperanza(weibull, shape = "X", scale = "Y") y ya devuelva esa esperanza
> así como la variaran de esa misma funcion
> Muchas gracias
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Repetir datos en una tabla

2016-07-01 Por tema Carlos J. Gil Bellosta

Y una solución "clásica":

iris[rep(1:nrow(iris), each = 24),]

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 1 de julio de 2016, 11:35, Olivier Nuñez <onu...@unex.es> escribió:
> Una solución con el paquete data.table:
>
>> require(data.table)
>> tabla=data.table(dia=1:10,y=rnorm(10))
>> tabla
> dia   y
>  1:   1 -1.04816325
>  2:   2 -0.23554981
>  3:   3  1.79809995
>  4:   4  0.07578478
>  5:   5 -1.38710527
>  6:   6  2.18929038
>  7:   7  0.52330030
>  8:   8 -0.34695695
>  9:   9 -0.10357643
> 10:  10 -0.76800351
>> tabla[,.(hora=1:24),by=.(dia,y)]
>  dia  y hora
>   1:   1 -1.04816321
>   2:   1 -1.04816322
>   3:   1 -1.04816323
>   4:   1 -1.04816324
>   5:   1 -1.04816325
>  ---
> 236:  10 -0.7680035   20
> 237:  10 -0.7680035   21
> 238:  10 -0.7680035   22
> 239:  10 -0.7680035   23
> 240:  10 -0.7680035   24
>
>
> Un saludo. Olivier
>
> - Mensaje original -
> De: "Novvier Marco Uscuchagua Cornelio" <novv...@gmail.com>
> Para: r-help-es@r-project.org
> Enviados: Jueves, 30 de Junio 2016 19:15:34
> Asunto: [R-es] Repetir datos en una tabla
>
> Buen día amigos,
> Tengo una tabla con registros de datos por día y quisiera convertirla en
> horas, es decir, repetir una fila 24 veces. Lo puedo hacer manualmente pero
> es un registro de 5 años y tardaría una eternidad. ¿Saben cual es método
> más rápido?
> De antemano muchas gracias.
> Atte. Marco.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] analisis estadistica hidrologica y de precipitaciones con R

2016-06-09 Por tema Carlos J. Gil Bellosta

Comienza por https://cran.r-project.org/web/views/Environmetrics.html

El 9 de junio de 2016, 21:07, Javier Valdes Cantallopts (DGA) <
javier.val...@mop.gov.cl> escribió:

> Necesito saber consejos sobre algún paquete para realizar análisis
> estadístico para hidrología y precipitaciones con R.
>
> Saludos.
>
>
>
> [image: R]
>
>
>
> --
>
> CONFIDENCIALIDAD: La información contenida en este mensaje y/o en los
> archivos adjuntos es de carácter confidencial o privilegiada y está
> destinada al uso exclusivo del emisor y/o de la persona o entidad a quien
> va dirigida. Si usted no es el destinatario, cualquier almacenamiento,
> divulgación, distribución o copia de esta información está estrictamente
> prohibido y sancionado por la ley. Si recibió este mensaje por error, por
> favor infórmenos inmediatamente respondiendo este mismo mensaje y borre
> todos los archivos adjuntos. Gracias.
>
> CONFIDENTIAL NOTE: The information transmitted in this message and/or
> attachments is confidential and/or privileged and is intented only for use
> of the person or entity to whom it is addressed. If you are not the
> intended recipient, any retention, dissemination, distribution or copy of
> this information is strictly prohibited and sanctioned by law. If you
> received this message in error, please reply us this same message and
> delete this message and all attachments. Thank you.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] sumar una variable con cast

2016-05-31 Por tema Carlos J. Gil Bellosta

?dcast. Mira los argumentos que admite la función. Uno de ellos se
llama value.var (o similar).

El día 31 de mayo de 2016, 20:52, Enrique RAMOS via R-help-es
<r-help-es@r-project.org> escribió:
> Estimado Javier Marcusi
> estoy intentando hacerlo con dcast ya logre que se realice la suma pero lo 
> hace con la ultima columna y yo requiero que se haga el mismo proceso con 
> varias columnas Saludos Enrique RAMOS
>
> El Martes, 31 de mayo, 2016 13:00:28, Javier Marcuzzi 
> <javier.ruben.marcu...@gmail.com> escribió:
>
>
>  Estimado Enrique Ramos
>
> Yo podría decir ¿y data.table?. Hay muchas alternativas (no envié antes sin 
> querer al correo).
>
> ¿Qué alternativa esta utilizando? Carlos Ortega y Carlos J. Gil Bellosta 
> aportaron dos soluciones posibles, ¿Cuál le da problemas?
>
>
> Javier Rubén Marcuzzi
>
> De: Javier Marcuzzi
> Enviado: martes, 31 de mayo de 2016 14:57
> Para: Enrique RAMOS via R-help-es; R-help-es@r-project.org
> Asunto: RE: [R-es] sumar una variable con cast
>
> Estimado Enrique Ramos
>
> Yo podría decir ¿y data.table?. Hay muchas alternativas
>
> Javier Rubén Marcuzzi
>
> De: Enrique RAMOS via R-help-es
> Enviado: martes, 31 de mayo de 2016 14:03
> Para: R-help-es@r-project.org
> Asunto: Re: [R-es] sumar una variable con cast
>
> yo de nuevo, ahora se me presento otro problema en la base de datos del 
> ejemplo solo tenia unas cuantas columnas mi base de datos tiene mas columnas 
> ahora el detalle es como puedo elegir la columna que quiero que sume porque 
> siempre me suma la que está en el extremo derechomil gracias
> Saludos
> Enrique RAMOS
>
> El Lunes, 30 de mayo, 2016 14:06:11, Enrique RAMOS via R-help-es 
> <r-help-es@r-project.org> escribió:
>
> agradezco la ayuda, el problema se resumía a que el Rstudio me ponía unos 
> paréntesis de forma automática los quite y asunto solucionado Saludos Enrique 
> RAMOS
>
> El Lunes, 30 de mayo, 2016 12:26:33, Carlos J. Gil Bellosta 
> <c...@datanalytics.com> escribió:
>
> Hola, ¿qué tal?
> Mira el argumento fun.aggregate en ?dcast.
> Un saludo,
> Carlos J. Gil Bellostahttp://www.datanalytics.com
> El 30 de mayo de 2016, 18:15, Enrique RAMOS via R-help-es 
> <r-help-es@r-project.org> escribió:
>
> buenas tardes les envío este mensaje de ayuda porque ya le batalle mucho y no 
> he podido hacerlo lo que necesito, tengo una tabla como la que pongo en el 
> archivo anexo ejemplo he estado utilizando la instrucción cast de reshape2 
> para generar algo como lo que sigue
>
> | Suma de evento | Etiquetas de columna |  |  |  |  |
> | Etiquetas de fila | 2000 | 2001 | 2002 | 2003 | 2004 | Total general |
> | D | 2 | 3 | 1 | 4 | 1 | 11 |
> | AU | 2 | 1 | 1 | 1 |  | 5 |
> | CA |  | 1 |  |  |  | 1 |
> | GV |  | 1 |  | 3 | 1 | 5 |
> | F | 3 | 4 | 1 | 3 | 3 | 14 |
> | AU | 1 |  |  |  | 2 | 3 |
> | CA | 1 | 3 |  |  |  | 4 |
> | GV | 1 | 1 | 1 | 3 | 1 | 7 |
> | Total general | 5 | 7 | 2 | 7 | 4 | 25 |
>
>  donde se obtiene la suma de los eventos en función del tipo y grupo por cada 
> año, lo que he logrado es obtener solo la cuenta de reglones
> de antemano mil gracias,
> Saludos Enrique RAMOSOficina de confiabilidadLAPEM-CFE
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Ayuda con Subset

2016-05-23 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Dos consejos. El primero, que no uses subset
<http://stackoverflow.com/questions/9860090/in-r-why-is-better-than-subset>.
Usa corchetes directamente.

El segundo, que utilices el operador %in%:

T[Tv2 %in% c(2,3),]

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 23 de mayo de 2016, 20:00, Rafael Saturno <rafael_satu...@hotmail.com>
escribió:

> Hola Comunidad, tengo este problema con una data
> La data es bastante grande, y necesito filtrarla por un campo en
> especifico segun lo que me interesa,con Subset puedo filtrar de la
> siguiente manera
> T <-
> rbind(data.frame(v1=rep("x",5),v2=sample(1:5)),data.frame(v1=rep("y",5),v2=sample(1:5)))
> ### DATA Ejemplo
> subset(T, v2==2 | v2==3)
> y trae lo que quiero,
> el problema es que en lo que quiero hacer tengo que filtrar por mas de 100
> valores de v2 y muy tedioso escribir todas esas condiciones, sin mencionar
> que me puedo equivocar muy facilmente
> trate de escribirlo
> subset(T, v2==c(2,3))
> pero R recicla el vector y no me trae todos los terminos que quiero
> Gracias xD
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Cargar un paquete propio

2016-05-18 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Casi seguro, es un problema de "encoding". ¿Estás desarrollando en Windows
(latin1) y subiendo al servidor en Linux (utf8)? Mira lo que se dice en

http://www.hep.by/gnu/r-patched/r-exts/R-exts_4.html

acerca de la codificación de caracteres en paquetes.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 18 de mayo de 2016, 12:23, david santolaria <
davidsantolariabello...@gmail.com> escribió:

> Hola,
>
> Al intentar instalar un paquete de R creado por mí, me da el siguiente
> problema. Utilizando rstudio en local me funciona, pero al intentar
> instalarlo en rstudio-server es cuando me da este error. He probado
> cosillas que he leído en internet, pero no han funcionado. ¿Alguna idea?
>
> * installing *source* package ‘mipaquete’ ...** RError in
> parse(outFile) : invalid multibyte character in parser at line 7ERROR:
> unable to collate and parse R files for package ‘mipaquete’
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Aplicar una función repetidamente

2016-05-12 Por tema Carlos J. Gil Bellosta

g <- function(f, x, k){
  for(i in 1:k)
x <- f(x)
  x
}

g(sqrt, 256, 3)

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El 12 de mayo de 2016, 10:40, rubenfcasal <rubenfca...@gmail.com> escribió:

> Yo de primeras lo haría así:
>
> f <- function(x) return(x^2)
>
> recursiva <- function(x, fun, k) {
>   if (k > 1) return(fun(recursiva(x, fun, k-1))) else return(fun(x))
> }
>
> > recursiva(2,f,1)
> [1] 4
> > recursiva(2,f,2)
> [1] 16
> > recursiva(2,f,3)
> [1] 256
> > f(f(f(2)))
> [1] 256
>
> Un saludo,
> Rubén FC
>
>
>
> El 12/05/2016 a las 10:29, Carlos Ortega escribió:
>
>> Hola Jorge,
>>
>> Creo que la función que buscas está del lado de las varias
>> implementaciones
>> que tiene "R" del lado de la "Programación Funcional".
>> En particular miraría la función "Reduce()".
>> Y también la función "accumulate()" del paquete de Hadley Wickham "purr"
>> (Functional Programming Tools).
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 12 de mayo de 2016, 5:39, Jorge I Velez <jorgeivanve...@gmail.com>
>> escribió:
>>
>> Hola a todos,
>>>
>>> Quisiera aplicar una función f(x) un total de k veces de manera
>>> recursiva.
>>> En pseudo código sería algo como
>>>
>>> Si k = 1, calcular f(x);
>>> Si k = 2, calcular f(f(x));
>>> Si k = 3, calcular f(f(f(x))).
>>>
>>> Al final me gustaria tener una función g cuyos argumentos sean x y el
>>> valor
>>> de k. Así,
>>>
>>> g(x, k = 2)
>>>
>>> daría como resultado f(f(x)).
>>>
>>> Cualquier ayuda y/o sugerencia será más que bienvenida.
>>>
>>> Muchísimas gracias,
>>> Jorge Velez.-
>>>
>>>  [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Web interesante (ROpenSci)

2016-04-21 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Efectivamente, voy a ser de los que diga que lo conocía. Y más que eso, lo
seguía de reojo con cierta envidia.

rOpenSci está pensado para "aplicaciones científicas" pero lo que se está
pidiendo a gritos (con las salvedades que indico debajo) es algo parecido
para datos "locales". Uso "locales" en lugar de "españoles", que es en lo
que estoy pensando por deferencia a lectores de otros países y porque
pueden aplicarse todo lo que diga a continuación.

Hay muchas fuentes de datos (con la salvedad que indicaré debajo) de datos
"locales" disponibles a través de APIs que pudieran ser utilizadas
programáticamente desde, p.e. aunque no exclusivamente, R: INE, IGN,
¿AEMET?, etc. Sería utiísima una colección de paquetes promovida
"localmente" para atacar esas fuentes de datos
https://github.com/cjgb/caRtociudadpúblicas.

Un ejemplo de paquete que trata de hacer algo así es caRtociudad (
https://github.com/cjgb/caRtociudad), que explota datos de
http://www.cartociudad.es (por ejemplo, para geolocalizar direcciones sin
las limitaciones de Google Maps).

La salvedad a la que me refería más arriba, sin embargo, es que apenas hay
fuentes de datos "locales" consultables vía APIs, i.e., programáticamente.
El INE, p.e., apenas tiene; la excepción creo que es un servicio
cartográfico que consulta caRtociudad (y que devuelve la sección censal
correspondiente a unas coordenadas).

Pero pienso --soy iluso en ocasiones-- que la demanda (p.e., a través de
herramientas sencillas de usar) podría incrementar la oferta.

Dicho lo cual, si alguien después de leer todo lo anterior siente algún
gusanillo por dentro, que me deje una nota y vemos qué cosas se pueden
hacer al respecto.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] ¿Es "R" recomendable como lenguaje para alguien que quiere empezar a programar?....

2016-04-20 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Algo que desconcierta a quienes aprenden R es que no existe una manera
obvia (y preferiblemente única) de hacer las cosas. En Python, por ejemplo,
se trata de que sea así (véase https://www.python.org/dev/peps/pep-0020/).

R es caótico, desordenado y está plagado de sublenguajes de toda ralea. Se
puede vivir con ello, pero es mejor mantener a los novatos en la
programación al margen de ese tipo de problemas. Python es más adecuado.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Contenido de un objeto/modelo ARIMA

2016-04-07 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Copio de la ayuda de la función:

library(forecast)
fit <- Arima(WWWusage,order=c(3,1,0))

names(fit)
# [1] "coef"  "sigma2""var.coef"  "mask"  "loglik"
# [6] "aic"   "arma"  "residuals" "call"  "series"
# [11] "code"  "n.cond""nobs"  "model" "aicc"
# [16] "bic"       "x"

Esos son los componentes del objeto resultante. En la ayuda de ?Arima,
en la sección "Value", explica qué son cada uno de ellos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El día 7 de abril de 2016, 10:54, david santolaria
<davidsantolariabello...@gmail.com> escribió:
> Buenos días,
>
> Os cuento:
>
> Cargo la librería "Forecast" y ejecuto su función Arima(...) sobre una
> serie temporal:
>
> mimodelo <- Arima(miST$miserie, ...);
>
> Ahora si ejecuto las siguientes sentencias, voy obteniendo los resultados
> contenidos en "mimodelo", pero algunos de ellos no sé lo que son:
>
> mimodelo[[1]] obtengo los coeficientes del modelo ARIMA
> mimodelo[[2]] obtengo el sigma^2
> mimodelo[[3]] obtengo la matriz de varianzas y covar de los coeficientes
> ...
>
> Pero por ejemplo: mimodelo[[4]] obtengo "true true true" y esto no tengo ni
> idea que es ¿significatividades?
>
> El caso es que en la documentación de la librería no explica nada de esto.
> ¿alguien sabe dónde o cómo se puede consultar?
>
> Gracias
> David
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Mann-Whitney con datos temporales

2016-03-29 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Estoy de acuerdo en todo menos en una cosa: que si las series están
autocorrelaccionadas (que lo estarán casi seguro), las diferencias también
lo estarán (necesariamente). Porque la primera cosa que se me ocurre (y no
me parece descabellada) es que si el efecto de la ubicación es aditivo, es
decir, si las temperaturas son

temp(t) + a1 + e1(t) para el sitio 1
temp(t) + a2 + e2(t) para el sitio 2

al tomar las diferencias hora a hora desaparecería el efecto de la serie
temporal subyacente, independientemente de su estructura y la prueba
pareada lo sería sobre la diferencia entre a1 y a2. Y la prueba por parejas
(de horas) tendría sentido.

Se puede comprobar (incluso a ojo; o más bien, primero y fundamentalmente a
ojo) si las diferencias tienen algún tipo de estructura temporal; en este
caso, quedaría invalidado todo lo dicho. Por supuesto.

Eso sí, sigue existiendo el problema de si las diferencias se deben a las
ubicaciones o a los sensores.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 29 de marzo de 2016, 12:15, José Trujillo Carmona <truji...@unex.es>
escribió:

> En mi modesta opinión el problema planteado no es con las réplicas.
>
> Efectivamente el problema de las réplicas existe. Al haber un único sensor
> en cada sitio no podrás saber si las diferencias las crea el sitio o el
> sensor. Para mí la solución, si fuese factible, sería intercambiar sensores
> un tiempo.
>
> Pero en todo caso el problema planteado creo que es comparar los dos
> conjuntos de datos, con la salvedad de que las diferencias pueden ser
> debidas al sitio o al sensor. Este problema topa con el problema principal
> de la falta de independencia entre observaciones.
>
> El test de Mann-Whitney-Wilcoxon, como los tests paramétricos
> convencionales, incluyen la suposición de que se está trabajando con una
> muestra obtenida mediante muestreo aleatorio simple, o lo que es lo mismo
> que los sucesivos valores encontrados son independientes entre sí. De hecho
> el calculo de la distribución de probabilidad del estadístico de contraste
> depende fuertemente de esta suposición.
>
> La solución que propone Carlos (tomar diferencias en datos apareados) no
> resuelve para nada el problema: si las series están autocorrelacionadas,
> las diferencias también lo estarán.
>
> En métodos paramétricos la solución es eliminar las componentes de
> autocorrelación hasta conseguir que la serie sea ruido blanco. Las
> soluciones no paramétricas suele ir en la misma dirección; aunque no creo
> que esté indicada la estimación de un modelo ARIMA (paramétrico). Ahora
> mismo no tengo tiempo de buscar las soluciones concretas, pero yo iría en
> la siguiente dirección:
>
> 1º Comprobar si efectivamente la serie está autocorrelacionada mediante
> algún test tipo test de Wald-Wolfowitz (ver en el paquete randtests). Si no
> lo estuviese la utilización directa de Mann-Whitney no tendría ningún
> problema.
>
> 2º Eliminar la autocorrelación mediante procedimientos de suavizado que
> por no necesitar la estimación de parámetros son "free distribution" como
> los de Suavizado Exponencial de Brown o los más complejos de Holt o incluso
> Holt-Winter.
>
> Con los residuos de la serie suavizada (o alisada) hasta que las
> observaciones sean independientes entre sí, utilizar el test de
> Mann-Whitney.
>
> Saludos.
>
>
>
> El 29/03/16 a las 10:05, Carlos J. Gil Bellosta escribió:
>
>> Hola, ¿qué tal?
>>
>> En el peor de los casos, tendrías que comparar parejas de temperaturas
>> (por
>> hora). Es decir, con paired = T. Aún así, como dices, tendrías el problema
>> de la correlación entre medidas.
>>
>> En este caso, como en casi todos, lo ideal es plantear un modelo similar a
>>
>> temp ~ temp(h) + sitio + error
>>
>> y ver si el coeficiente de sitio es o no cero. El problema particular de
>> este ejemplo es que temp(h) (un modelo para la temperatura en función de
>> la
>> hora) es una función no lineal. Igual podrías probar con los GAM.
>>
>> Un saludo,
>>
>> Carlos J. Gil Bellosta
>> http://www.datanalytics.com
>>
>>
>> El 28 de marzo de 2016, 16:56, Javier Martínez-López <
>> javi.martinez.lo...@gmail.com> escribió:
>>
>> Hola a tod@s,
>>>
>>> queremos hacer una comparación entre dos lugares muy alejados entre sí
>>> en relación a la temperatura de cada sitio usando medias horarias de
>>> un período determinado. Sólo hay medidas de un sensor en cada sitio y
>>> queremos saber si las diferencias son significativas o no entre
>>> sitios/curvas. Hemos usado un test de Mann–Whitney U con la función
>>> wilcox.test (paired=F) ya que los valores n

Re: [R-es] Mann-Whitney con datos temporales

2016-03-29 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

En el peor de los casos, tendrías que comparar parejas de temperaturas (por
hora). Es decir, con paired = T. Aún así, como dices, tendrías el problema
de la correlación entre medidas.

En este caso, como en casi todos, lo ideal es plantear un modelo similar a

temp ~ temp(h) + sitio + error

y ver si el coeficiente de sitio es o no cero. El problema particular de
este ejemplo es que temp(h) (un modelo para la temperatura en función de la
hora) es una función no lineal. Igual podrías probar con los GAM.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El 28 de marzo de 2016, 16:56, Javier Martínez-López <
javi.martinez.lo...@gmail.com> escribió:

> Hola a tod@s,
>
> queremos hacer una comparación entre dos lugares muy alejados entre sí
> en relación a la temperatura de cada sitio usando medias horarias de
> un período determinado. Sólo hay medidas de un sensor en cada sitio y
> queremos saber si las diferencias son significativas o no entre
> sitios/curvas. Hemos usado un test de Mann–Whitney U con la función
> wilcox.test (paired=F) ya que los valores no son normales (n = 24; 24h
> en base a medias minutales). ¿Creéis que es correcto o estaríamos
> incumpliendo alguna asunción del test al ser datos temporales y/o no
> tener réplicas de los sensores?
>
> Muchas gracias y saludos,
>
> Javier
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] no puedo instalar knitr y Rmarkdown en ubuntu

2016-03-15 Por tema Carlos J. Gil Bellosta

Hummm...

stringr depende de stringi, que es el que da el error. Prueba

install.packages("stringr", dependencies = TRUE)

En principio, R debería instalar todas las dependencias. Pero parece que no
es el caso aquí.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 16 de marzo de 2016, 1:55, Jose Ramirez Costa <joseramirezco...@gmail.com
> escribió:

> Hola Carlos, el ubuntu tiene compilador :)
>
> Este es el error completo al querer instalar el paquete stringr
>
>
> Installing package into ‘/home/jose210179/R/i686-pc-linux-gnu-library/3.2’
> (as ‘lib’ is unspecified)
> --2016-03-15 21:46:23--
> https://cran.rstudio.com/src/contrib/stringr_1.0.0.tar.gz
> Resolviendo cran.rstudio.com (cran.rstudio.com)... 54.230.163.212
> Conectando con cran.rstudio.com (cran.rstudio.com)[54.230.163.212]:443...
> conectado.
> Petición HTTP enviada, esperando respuesta... 200 OK
> Longitud: 34880 (34K) [application/x-gzip]
> Grabando a: “/tmp/RtmpquRv1d/downloaded_packages/stringr_1.0.0.tar.gz”
>
>  0K .. .. ..  100%
> 84,9K=0,4s
>
> 2016-03-15 21:46:25 (84,9 KB/s) -
> “/tmp/RtmpquRv1d/downloaded_packages/stringr_1.0.0.tar.gz” guardado
> [34880/34880]
>
> * installing *source* package ‘stringr’ ...
> ** package ‘stringr’ successfully unpacked and MD5 sums checked
> ** R
> ** inst
> ** preparing package for lazy loading
> Error in library.dynam(lib, package, package.lib) :
>   shared object ‘stringi.so’ not found
> ERROR: lazy loading failed for package ‘stringr’
> * removing ‘/home/jose210179/R/i686-pc-linux-gnu-library/3.2/stringr’
> Warning in install.packages :
>   installation of package ‘stringr’ had non-zero exit status
>
> The downloaded source packages are in
> ‘/tmp/RtmpquRv1d/downloaded_packages’
>
> El 15 de marzo de 2016, 21:06, Carlos J. Gil Bellosta <
> c...@datanalytics.com> escribió:
>
>> Hola, ¿qué tal?
>>
>> Trata de instalar el paquete stringr primero (que es el que da error).
>> ¿Te deja? Si hay error, ¿puedes copiar el mensaje completo?
>>
>> Una pregunta tonta: en tu Ubuntu, ¿hay compilador?
>>
>> Un saludo,
>>
>> Carlos J. Gil Bellosta
>> http://www.datanalytics.com
>>
>> El 16 de marzo de 2016, 0:41, Jose Ramirez Costa <
>> joseramirezco...@gmail.com> escribió:
>>
>>> Buenas, he intentado varias veces instalar knitr y Rmarkdown tanto desde
>>> Rstudio como desde la terminal de Ubuntu usando diferentes codigos y en
>>> nunca consegui q lo instalara.
>>>
>>> el error q tira es el siguiente:
>>> Warning in install.packages :
>>>   installation of package
>>> ‘/tmp/RtmpavyTWw/downloaded_packages/stringr_1.0.0.tar.gz’ had non-zero
>>> exit status
>>>
>>> Alguien me podria ayudar, porq estoy dejando definitivamente windows,
>>> pero
>>> si no me anda R al 100% no puedo mudarme a ubuntu.
>>>
>>> Gracias, saludos
>>> --
>>> "*“Que tudo pesado se torne leve, todo corpo, dançarino, e todo espírito,
>>> pássaro.” *
>>> *Nietzsche, "Assim Falou Zaratustra”.*
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>>
>
>
> --
> "*“Que tudo pesado se torne leve, todo corpo, dançarino, e todo espírito,
> pássaro.” *
> *Nietzsche, "Assim Falou Zaratustra”.*
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] no puedo instalar knitr y Rmarkdown en ubuntu

2016-03-15 Por tema Carlos J. Gil Bellosta

Hola, ¿qué tal?

Trata de instalar el paquete stringr primero (que es el que da error). ¿Te
deja? Si hay error, ¿puedes copiar el mensaje completo?

Una pregunta tonta: en tu Ubuntu, ¿hay compilador?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 16 de marzo de 2016, 0:41, Jose Ramirez Costa <joseramirezco...@gmail.com
> escribió:

> Buenas, he intentado varias veces instalar knitr y Rmarkdown tanto desde
> Rstudio como desde la terminal de Ubuntu usando diferentes codigos y en
> nunca consegui q lo instalara.
>
> el error q tira es el siguiente:
> Warning in install.packages :
>   installation of package
> ‘/tmp/RtmpavyTWw/downloaded_packages/stringr_1.0.0.tar.gz’ had non-zero
> exit status
>
> Alguien me podria ayudar, porq estoy dejando definitivamente windows, pero
> si no me anda R al 100% no puedo mudarme a ubuntu.
>
> Gracias, saludos
> --
> "*“Que tudo pesado se torne leve, todo corpo, dançarino, e todo espírito,
> pássaro.” *
> *Nietzsche, "Assim Falou Zaratustra”.*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

1 2 >

1 - 100 de 155 matches

Mail list logo