Re: [R-es] Extraer texto de una columna en Excel

2023-03-31 Por tema Carlos Ortega
OK.
Si ya lo tienes resuelto...

Gracias,
Carlos.

El vie, 31 mar 2023 a las 19:23, David Camilo Gomez Medina (<
dcgome...@unal.edu.co>) escribió:

> Muchas gracias por la alternativa de utilizar la librería stringi, Carlos,
> no la conocía.
>
> On Fri, 31 Mar 2023 at 12:11, David Camilo Gomez Medina <
> dcgome...@unal.edu.co> wrote:
>
>> Muchas gracias Carlos, lo que quiero hacer es lo siguiente: extraer el
>> texto que hay entre textura/s hasta el punto final.
>> Ejemplo:
>> *Moderadamente profundos, bien drenados, de textura franco arenosa a
>> franco arcillo arenosa. Fertilidad natural media*
>> Lo que quiero extraer sería:  *franco arenosa a franco arcillo arenosa *
>>
>> Al final lo pude realizar de la siguiente manera:
>>
>> df <- read_excel("Agrologia.xlsx")
>>
>> df$Extracted_Text <- trimws(str_extract(df$CARACTERIS,
>> "(?<=textura?(?:[^a-zA-Z]|s)).*?(?=\\.)"))
>>
>> Estoy abierto a cualquier sugerencia o comentario.
>>
>> Muchas gracias.
>>
>> On Fri, 31 Mar 2023 at 12:03, Carlos Ortega 
>> wrote:
>>
>>> Hola,
>>>
>>> Como no sé lo que querías, veo dos alternativas...
>>> Yo suelo usar "stringi" en vez de "stringr"
>>>
>>> #-
>>> library(readxl)
>>> library(stringi)
>>> datos <- read_excel("Agrologia.xlsx")
>>> toextract <- unlist(stri_extract_all_fixed(datos$CARACTERIS, "textura"))
>>>
>>> #--- Si quiero un dataframe completo donde CARACTERIS tenga "textura" o
>>> "texturas"
>>> lineas_textura <- datos[ !is.na(toextract), ]
>>> #--- Si quiero los elementos de CARACTERIS que tiene "textura" o
>>> "texturas"
>>> campo_textura <- datos$CARACTERIS[ !is.na((toextract))]
>>> #---
>>>
>>> Gracias,
>>>
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El vie, 31 mar 2023 a las 17:20, David Camilo Gomez Medina (<
>>> dcgome...@unal.edu.co>) escribió:
>>>
>>>> Buen día,
>>>>
>>>> Estoy extrayendo solo una parte de texto de una celda en Excel, pero
>>>> tengo un inconveniente. Quiero extraer el texto desde donde dice
>>>> *textura* hasta el siguiente punto, pero hay unas celdas que dicen
>>>> *texturas* y me está extrayendo también ésta *s*, cómo podría cambiar
>>>> el siguiente código para que me extraiga tanto textura como texturas. Quedo
>>>> muy atento, gracias.
>>>>
>>>> rm(list = ls())
>>>>
>>>> library(readxl)
>>>> library(stringr)
>>>> library(openxlsx)
>>>>
>>>> setwd("~/INFO_DIEGO/R")
>>>>
>>>> df <- read_excel("Agrologia.xlsx")
>>>>
>>>> df$Extracted_Text <- str_extract(df$CARACTERIS, "(<=?textura?).*?\\.")
>>>>
>>>> write.xlsx(df, "modified_file.xlsx")
>>>>
>>>>
>>>>
>>>>
>>>> *Aviso legal:* El contenido de este mensaje y los archivos adjuntos
>>>> son confidenciales y de uso exclusivo de la Universidad Nacional de
>>>> Colombia. Se encuentran dirigidos sólo para el uso del destinatario al cual
>>>> van enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
>>>> cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
>>>> recibido por error, infórmenos y elimínelo de su correo. Los Datos
>>>> Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
>>>> Política de Datos Personales que podrá consultar en la página web
>>>> www.unal.edu.co. Las opiniones, informaciones, conclusiones y
>>>> cualquier otro tipo de dato contenido en este correo electrónico, no
>>>> relacionados con la actividad de la Universidad Nacional de Colombia, se
>>>> entenderá como personales y de ninguna manera son avaladas por la
>>>> Universidad.
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
> *Aviso legal:* El contenido de este mensaje y los archivos adjuntos son
> confidenciales y de uso exclusivo de la Universidad Nacional de Colombia.
> Se encuentran dirigidos sólo para el uso del destinatario al cual van
> enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
> cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
> recibido por error, infórmenos y elimínelo de su correo. Los Datos
> Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
> Política de Datos Personales que podrá consultar en la página web
> www.unal.edu.co. Las opiniones, informaciones, conclusiones y cualquier
> otro tipo de dato contenido en este correo electrónico, no relacionados con
> la actividad de la Universidad Nacional de Colombia, se entenderá como
> personales y de ninguna manera son avaladas por la Universidad.
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Función aggregate en dataframe

2023-03-29 Por tema Carlos Ortega
OK. Bien.

El mié, 29 mar 2023 a las 22:20, David Camilo Gomez Medina (<
dcgome...@unal.edu.co>) escribió:

> Listo, gracias.
>
> On Wed, 29 Mar 2023 at 15:19, Carlos Ortega 
> wrote:
>
>> Ah... veo que tienes algunos valores nulos...
>> Entonces para calcular la media, habría que incluir este otro cambio:
>>
>> *+   mutate(mes_avg = mean(value, na.rm = TRUE), .by = c(month, vars))
>> %>%*
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> El mié, 29 mar 2023 a las 22:17, Carlos Ortega ()
>> escribió:
>>
>>> Ah...
>>> Sí, de esta forma...
>>>
>>> > resout <- df %>%
>>> +   mutate(year = year(ym(yearmon))) %>%
>>> +   mutate(month = month(ym(yearmon))) %>%
>>> +   select(-year) %>%
>>> +   relocate(month, .after = yearmon) %>%
>>> +
>>>
>>> *  pivot_longer( cols = X1:X5, names_to = "vars" ) %>%+   mutate(mes_avg
>>> = mean(value), .by = c(month, vars)) %>%+   select(month, vars, mes_avg)
>>> %>%*
>>> +   distinct() %>%
>>> +   as.data.frame
>>> > resout
>>>month vars   mes_avg
>>> 1  1   X1 0.5063388
>>> 2  1   X2 0.6054863
>>> 3  1   X3 0.4747568
>>> 4  1   X4 0.6525521
>>> 5  1   X5 0.3378098
>>> 6  2   X1 0.6480751
>>> 7  2   X2 0.3866987
>>> 8  2   X3 0.5628610
>>> 9  2   X4 0.2965187
>>> 10 2   X5 0.5039561
>>> 11 3   X1 0.3565034
>>> 12 3   X2 0.5595157
>>> 13 3   X3 0.4526992
>>> 14 3   X4 0.5256429
>>> 15 3   X5 0.5396339
>>> 16 4   X1 0.3492785
>>> 17 4   X2 0.4719472
>>> 18 4   X3 0.6069615
>>> 19 4   X4 0.5099684
>>> 20 4   X5 0.5375129
>>> 21 5   X1 0.6083371
>>> 22 5   X2 0.6986131
>>> 23 5   X3 0.3419662
>>> 24 5   X4 0.4950851
>>> 25 5   X5 0.5467911
>>> 26 6   X1 0.2031233
>>> 27 6   X2 0.4891435
>>> 28 6   X3 0.3186853
>>> 29 6   X4 0.7101540
>>> 30 6   X5 0.4964806
>>> 31 7   X1 0.4853932
>>> 32 7   X2 0.5883874
>>> 33 7   X3 0.8781151
>>> 34 7   X4 0.4065725
>>> 35 7   X5 0.3009754
>>> 36 8   X1 0.4974401
>>> 37 8   X2 0.6118529
>>> 38 8   X3 0.6042984
>>> 39 8   X4 0.3386884
>>> 40 8   X5 0.6710002
>>> 41 9   X1 0.6392356
>>> 42 9   X2 0.4150898
>>> 43 9   X3 0.5861839
>>> 44 9   X4 0.4325483
>>> 45 9   X5 0.6310271
>>> 4610   X1 0.4523220
>>> 4710   X2 0.5130199
>>> 4810   X3 0.3362966
>>> 4910   X4 0.5372736
>>> 5010   X5 0.5077318
>>> 5111   X1 0.4055051
>>> 52    11   X2 0.4510812
>>> 5311   X3 0.2245734
>>> 5411   X4 0.7682052
>>> 5511   X5 0.3541822
>>> 5612   X1 0.6346173
>>> 5712   X2 0.5956540
>>> 5812   X3 0.3881634
>>> 5912   X4 0.6156253
>>> 6012   X5 0.6732854
>>> >
>>>
>>> #-
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>> El mié, 29 mar 2023 a las 22:12, David Camilo Gomez Medina (<
>>> dcgome...@unal.edu.co>) escribió:
>>>
>>>> Muchísimas gracias Carlos, aunque yo quiero conservar las columnas. Por
>>>> ejemplo, tú creaste información del año 2019 a 2022, para la columna X1
>>>> quiero calcular el promedio de enero para esos años y así con las demás
>>>> columnas. ¿Cómo podría cambiar tu código?
>>>>
>>>> On Wed, 29 Mar 2023 at 15:05, Carlos Ortega 
>>>> wrote:
>>>>
>>>>> Ah, gracias..
>>>>>
>>>>> Me he creado uno de forma sintética...
>>>>> Esta es una forma...
>>>>>
>>>>> #-
>>>>> > library(dplyr)
>>>>> > library(tidyr)
>>>>> > library(lubridate)
>>>>> >
>>>>> >
>>>>> > crear_data_frame <- function(anios_inicio, anios_fin) {
>>>>> +   anios_meses <- expand.grid(Year = anios_inicio:anios_fin, Month =
>>>>> 1:12)
>>>>> +   anios_meses$yearmon <- past

Re: [R-es] Función aggregate en dataframe

2023-03-29 Por tema Carlos Ortega
Ah... veo que tienes algunos valores nulos...
Entonces para calcular la media, habría que incluir este otro cambio:

*+   mutate(mes_avg = mean(value, na.rm = TRUE), .by = c(month, vars)) %>%*

Saludos,
Carlos Ortega
www.qualityexcellence.es



El mié, 29 mar 2023 a las 22:17, Carlos Ortega ()
escribió:

> Ah...
> Sí, de esta forma...
>
> > resout <- df %>%
> +   mutate(year = year(ym(yearmon))) %>%
> +   mutate(month = month(ym(yearmon))) %>%
> +   select(-year) %>%
> +   relocate(month, .after = yearmon) %>%
> +
>
> *  pivot_longer( cols = X1:X5, names_to = "vars" ) %>%+   mutate(mes_avg =
> mean(value), .by = c(month, vars)) %>%+   select(month, vars, mes_avg) %>%*
> +   distinct() %>%
> +   as.data.frame
> > resout
>month vars   mes_avg
> 1  1   X1 0.5063388
> 2  1   X2 0.6054863
> 3  1   X3 0.4747568
> 4  1   X4 0.6525521
> 5  1   X5 0.3378098
> 6  2   X1 0.6480751
> 7  2   X2 0.3866987
> 8  2   X3 0.5628610
> 9  2   X4 0.2965187
> 10 2   X5 0.5039561
> 11 3   X1 0.3565034
> 12 3   X2 0.5595157
> 13 3   X3 0.4526992
> 14 3   X4 0.5256429
> 15 3   X5 0.5396339
> 16 4   X1 0.3492785
> 17 4   X2 0.4719472
> 18 4   X3 0.6069615
> 19 4   X4 0.5099684
> 20 4   X5 0.5375129
> 21 5   X1 0.6083371
> 22 5   X2 0.6986131
> 23 5   X3 0.3419662
> 24 5   X4 0.4950851
> 25 5   X5 0.5467911
> 26 6   X1 0.2031233
> 27 6   X2 0.4891435
> 28 6   X3 0.3186853
> 29 6   X4 0.7101540
> 30 6   X5 0.4964806
> 31 7   X1 0.4853932
> 32 7   X2 0.5883874
> 33 7   X3 0.8781151
> 34 7   X4 0.4065725
> 35 7   X5 0.3009754
> 36 8   X1 0.4974401
> 37 8   X2 0.6118529
> 38 8   X3 0.6042984
> 39 8   X4 0.3386884
> 40 8   X5 0.6710002
> 41 9   X1 0.6392356
> 42 9   X2 0.4150898
> 43 9   X3 0.5861839
> 44 9   X4 0.4325483
> 45 9   X5 0.6310271
> 4610   X1 0.4523220
> 4710   X2 0.5130199
> 4810   X3 0.3362966
> 4910   X4 0.5372736
> 5010   X5 0.5077318
> 5111   X1 0.4055051
> 5211   X2 0.4510812
> 5311   X3 0.2245734
> 5411   X4 0.7682052
> 5511   X5 0.3541822
> 5612   X1 0.6346173
> 5712   X2 0.5956540
> 5812   X3 0.3881634
> 5912   X4 0.6156253
> 6012   X5 0.6732854
> >
>
> #-
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El mié, 29 mar 2023 a las 22:12, David Camilo Gomez Medina (<
> dcgome...@unal.edu.co>) escribió:
>
>> Muchísimas gracias Carlos, aunque yo quiero conservar las columnas. Por
>> ejemplo, tú creaste información del año 2019 a 2022, para la columna X1
>> quiero calcular el promedio de enero para esos años y así con las demás
>> columnas. ¿Cómo podría cambiar tu código?
>>
>> On Wed, 29 Mar 2023 at 15:05, Carlos Ortega 
>> wrote:
>>
>>> Ah, gracias..
>>>
>>> Me he creado uno de forma sintética...
>>> Esta es una forma...
>>>
>>> #-
>>> > library(dplyr)
>>> > library(tidyr)
>>> > library(lubridate)
>>> >
>>> >
>>> > crear_data_frame <- function(anios_inicio, anios_fin) {
>>> +   anios_meses <- expand.grid(Year = anios_inicio:anios_fin, Month =
>>> 1:12)
>>> +   anios_meses$yearmon <- paste0(anios_meses$Year, "-", sprintf("%02d",
>>> anios_meses$Month))
>>> +   vars <- replicate(5, runif(nrow(anios_meses)))
>>> +   data.frame(anios_meses, vars, stringsAsFactors = FALSE) %>%
>>> + select(-Year, -Month) %>%
>>> + arrange(yearmon)
>>> + }
>>> >
>>> > df <- crear_data_frame(2019, 2022)
>>> >
>>> > head(df)
>>>   yearmonX1X2  X3X4 X5
>>> 1 2019-01 0.2783405 0.1556831 0.007564986 0.9981701 0.35200632
>>> 2 2019-02 0.3906244 0.1525354 0.794696565 0.6935012 0.15611665
>>> 3 2019-03 0.3607439 0.2350400 0.208026463 0.1175302 0.84753470
>>> 4 2019-04 0.7787032 0.371 0.697207166 0.3701457 0.04013776
>>> 5 2019-05 0.4973347 0.6898472 0.603442922 0.5696876 0.63328772
>>> 6 2019-06 0.5392983 0.9604180 0.45617 0.7767546 0.62486765
>>> >
>>> > resout <- df %>%
>>> +   mutate(year = year(ym(yearmon))) %>%
>>> +   mutate(month = month(ym(yearmon))) %>%
>>> +   select(-year) %>%
>>> +   relocate(mon

[R-es] Grupo de Usuarios de R de Madrid - Jueves 29 de septiembre (presencial/online).

2022-09-22 Por tema Carlos Ortega
Hola,

El jueves 29 de septiembre, celebraremos la siguiente reunión del "Grupo de
R de Madrid".

En esta ocasión contaremos con Rasana Ferrero, directora académica de
"Máxima Formación" que nos hablará de:

*"Consejos para comenzar tu carrera de ciencia de datos con R".*

Más detalles de la sesión aquí:

https://www.meetup.com/es-ES/grupo-de-usuarios-de-r-de-madrid/events/288647594/

Gracias,
Carlos.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] semana

2021-03-20 Por tema Carlos Ortega
Hola,

¿Te refieres a encontrar la semana a la que pertenece un día?

#
> library(lubridate)

Attaching package: ‘lubridate’

The following objects are masked from ‘package:base’:

date, intersect, setdiff, union

> x <- ymd("2012-03-26")
> week(x)
[1] 13
#

Gracias,
Carlos.

El sáb, 20 mar 2021 a las 13:50, Jose Betancourt Bethencourt (<
betans...@gmail.com>) escribió:

> Estimados
> como convertir una columna de datos diarios a semanales?
> saludos
> --
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Agrupar dummy's en otra variable.

2021-03-12 Por tema Carlos Ortega
Hola,

Esta podría ser una forma...

#--
library(dplyr)
library(tidyr)
library(data.table)

datin <- fread('base_enfermedades_dummy.csv')

#Demencia, Cáncer, Enfermedad Cardíaca, Enfermedad pulmonar y Diabetes

to_keep <- c('paciente', 'Demencia', 'Cáncer', 'Enfermedad Cardíaca',
 'Enfermedad Pulmonar' , 'Diabetes')
to_rest <- setdiff(names(datin), to_keep)

datin_rel <- datin %>% relocate(all_of(to_keep), .before = all_of(to_rest))
datinnew <- datin_rel
datrest <- datin_rel[, (length(to_keep)+1):ncol(datin_rel)]

# Conseguir columna "Otros"
datinnew$sum_keep <- rowSums(datin_rel[, 2:length(to_keep)])
datinnew$sum_rest <- rowSums(datin_rel[,
(length(to_keep)+1):ncol(datin_rel)])
datinnew$Otros <- ifelse(datinnew$sum_rest > 0, 1, 0)

#--- Conseguir columna "Enfermedades_otras"
datinnew$Enfermedades_otras <- apply( datrest, 1,
  function(u) paste( names(which(u >
0)), collapse = "," ) )

#--

Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue, 11 mar 2021 a las 20:03, juan manuel dias ()
escribió:

> Hola Estimados/as,
>
>
>
> Hace unos días consulté cómo generar variables dummy cuándo las opciones
> de respuesta están cargadas en una misma columna/variable y separadas por
> una coma “,”.
>
>
>
> Tenía esto:
>
> [image: image.png]
>
>
>
> Y debía generar como primer paso esto:
>
>
>
> ab<-base %>%
>
>   separate_rows(enfermedad, sep = ",") %>%
>
>   mutate(enfermedad = str_squish(enfermedad))
>
>
>
> [image: image.png]
>
>
> Y finalmente obtener como resultado las dummy:
>
>
>
> ab<-base %>%
>
>   separate_rows(enfermedad, sep = ",") %>%
>
>   mutate(enfermedad = str_squish(enfermedad), # Para quitar los espacios
> en blanco indeseados
>
>  id = 1) %>%
>
>   spread(key = enfermedad, value = id)
>
>
>
> ab[is.na(ab)] <- 0
>
>
> write.csv(ab,file='base_enfermedades_dummy.csv')
>
>
> [image: image.png]
>
>
>
>
> Actualmente estoy necesitando lo siguiente: conservar las variables
> *Demencia*, *Cáncer*, *Enfermedad Cardíaca*, *Enfermedad pulmonar* y
> *Diabetes* y al resto de las variables/enfermedades agruparlas en una
> nueva variable “otros”, que sea 1 ó 0 si el caso/paciente tiene 1 en
> cualquiera de las enfermedades que no son las que menciono arriba.
>
>
> Asimismo, necesito generar una nueva variable "*Enfermedades_otras*"
> donde figuren cuáles son las enfermedades que mencionó el paciente en
> otros, y que estén separadas por una coma.
>
>
>
> Adjunto la base en csv (*base_enfermedades_dummy)  *y en el excel (
> *Ejemplo_agrupar_en_otros*) dejo un ejemplo de lo que intento hacer.
>
>
> Muchas gracias! Juan.
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] simulación1

2021-03-07 Por tema Carlos Ortega
Hola José,
He incluido la línea como ejemplo, con fines didácticos para que veas cómo
se hace. Sin ningún otro objetivo que pudiera estar asociado a tu estudio.

Para añadir una línea/curva o puntos sueltos, tienes primero que conseguir
esos puntos en un data.frame y luego representarles como indico a través de
las funciones "points()", "lines()"...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 7 mar 2021 a las 20:54, Jose Betancourt Bethencourt (<
betans...@gmail.com>) escribió:

> El anterior no se veia, esta linea no tiene sentido
>
>
>
>
> El 7/3/21, Carlos Ortega  escribió:
> > Hola,
> >
> > Fíjate que usas "plot()", el sitema gráfico por defecto de "R".
> > Sobre el plot que tienes, puedes usar las funciones "points()", o
> "lines()"
> > para añadir elementos a ese gráfico.
> >
> > En este ejemplo añado una línea horizontal a la altura de y = 100.
> >
> > #--
> > library(EpiModel)
> > # SIR Model with Vital Dynamics (One-Group)
> > param <- param.dcm(inf.prob = 0.2, act.rate = 10,
> >rec.rate = 1/3, a.rate = 1/90, ds.rate = 1/100,
> >di.rate = 1/35, dr.rate = 1/100)
> > init <- init.dcm(s.num = 500, i.num = 1, r.num = 0)
> > control <- control.dcm(type = "SIR", nsteps = 15)
> > mod2 <- dcm(param, init, control)
> > mod2
> > plot(mod2)
> > *lines( 1:10, rep(100,10))*
> > #-
> >
> > Gracias,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
> > El dom, 7 mar 2021 a las 12:36, Jose Betancourt Bethencourt (<
> > betans...@gmail.com>) escribió:
> >
> >> Estimados
> >> Quisieramos saber como   agregar al modelo que se presenta debajo una
> >> linea  de casos reales a la simulación, la cual ya tiene ya tiene una
> >> linea de susceptibles, una de infecciosos y otra de rcuperados
> >>
> >>
> >> saludos
> >> José
> >>
> >> library(EpiModel)
> >> SIR Model with Vital Dynamics (One-Group)
> >> param <- param.dcm(inf.prob = 0.2, act.rate = 10,
> >>rec.rate = 1/3, a.rate = 1/90, ds.rate = 1/100,
> >>di.rate = 1/35, dr.rate = 1/100)
> >> init <- init.dcm(s.num = 500, i.num = 1, r.num = 0)
> >> control <- control.dcm(type = "SIR", nsteps = 15)
> >> mod2 <- dcm(param, init, control)
> >> mod2
> >> plot(mod2)
> >>
> >> --
> >> Dr. Jose A. Betancourt Bethencourt
> >> Universidad de Ciencias Medicas Carlos j. Finlay
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >
> > --
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
>
>
> --
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] simulación1

2021-03-07 Por tema Carlos Ortega
Hola,

Fíjate que usas "plot()", el sitema gráfico por defecto de "R".
Sobre el plot que tienes, puedes usar las funciones "points()", o "lines()"
para añadir elementos a ese gráfico.

En este ejemplo añado una línea horizontal a la altura de y = 100.

#--
library(EpiModel)
# SIR Model with Vital Dynamics (One-Group)
param <- param.dcm(inf.prob = 0.2, act.rate = 10,
   rec.rate = 1/3, a.rate = 1/90, ds.rate = 1/100,
   di.rate = 1/35, dr.rate = 1/100)
init <- init.dcm(s.num = 500, i.num = 1, r.num = 0)
control <- control.dcm(type = "SIR", nsteps = 15)
mod2 <- dcm(param, init, control)
mod2
plot(mod2)
*lines( 1:10, rep(100,10))*
#-

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 7 mar 2021 a las 12:36, Jose Betancourt Bethencourt (<
betans...@gmail.com>) escribió:

> Estimados
> Quisieramos saber como   agregar al modelo que se presenta debajo una
> linea  de casos reales a la simulación, la cual ya tiene ya tiene una
> linea de susceptibles, una de infecciosos y otra de rcuperados
>
>
> saludos
> José
>
> library(EpiModel)
> SIR Model with Vital Dynamics (One-Group)
> param <- param.dcm(inf.prob = 0.2, act.rate = 10,
>rec.rate = 1/3, a.rate = 1/90, ds.rate = 1/100,
>di.rate = 1/35, dr.rate = 1/100)
> init <- init.dcm(s.num = 500, i.num = 1, r.num = 0)
> control <- control.dcm(type = "SIR", nsteps = 15)
> mod2 <- dcm(param, init, control)
> mod2
> plot(mod2)
>
> --
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ordenar gráficos de distribución de frecuencias con ggplot2

2021-03-07 Por tema Carlos Ortega
Hola Manuel,

A ver si esto te puede ayudar.

*#- Ordenar gráficos de acuerdo a  un estadístico no
alfabético --*
*library(forcats)*

pIFd = data %>%
  gather(x, y, NPP) %>%
  ggplot(aes(x = y, y =* fct_reorder(Clst, median(x)) *, color = Clst, fill
= Clst)) +
  facet_wrap( ~ x, scale = "free", ncol = 3) +
  scale_fill_tableau() +
  scale_color_tableau() +
  geom_density_ridges(alpha = 0.8) +
  guides(fill = F, color = F)

windows();pIFd

*#- Gráficos todos juntos  --*
Mira esta ayuda:
https://www.r-graph-gallery.com/135-stacked-density-graph.html

Gracias,
Carlos Ortega
www.qualityexcellence.es


El dom, 7 mar 2021 a las 6:27, Manuel Mendoza ()
escribió:

> Buenos días, como veis en el código que os copio abajo, represento la
> distribución de la frecuencia de muestras de las 6 categorías presentes en
> la variable Clst, a lo largo de la variable NPP. Me representa los 6
> gráficos ordenados de arriba a abajo. Dos cuestiones:
> 1. ¿Cómo le puedo indicar el orden?
> 2. ¿Cómo puedo representar los 6 juntos, superpuestos (con cierta
> transparencia) en un mismo gráfico?
>
> Muchas gracias, como siempre,
> Manuel
>
>
> pIFd = data %>%
>   gather(x, y, NPP) %>%
>   ggplot(aes(x = y, y = Clst, color = Clst, fill = Clst)) +
>   facet_wrap( ~ x, scale = "free", ncol = 3) +
>   scale_fill_tableau() +
>   scale_color_tableau() +
>   geom_density_ridges(alpha = 0.8) +
>   guides(fill = F, color = F)
>
> windows();pIFd
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] HELP!! Expansión de variables en una base de datos con ID duplicados

2021-02-28 Por tema Carlos Ortega
Hola,

Otra alternativa es la siguiente usando data.table.
En el ejemplo genero/incluyo un pequeño dataset para reproducir el caso...

#--
library(data.table)
set.seed(10)
DT <- data.table(
  Id= sample(1:10, 100, replace = TRUE),
  Nro_visita= sample(1:10, 100, replace = TRUE),
  X = rnorm(100),
  Y = rnorm(100),
  Z = rnorm(100)
)

#--- Convertir tu data.frame a data.table
# DT <- as.data.frame(tu_df)

#--- Ordeno el data.table por ID y por nro_visita en orden decreciente.
setorder(DT, Id, -Nro_visita)
#--- Me quedo solo con el primer elemento de cada Id. Que es la última
visita
res_dt <- DT[ , .SD[1], by = Id]
res_dt

#

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 28 feb 2021 a las 15:38, kendy Boisrond ()
escribió:

> Hola Comunidad,
>
> Por favor necesito su ayuda:
>
> Se trata de una base, donde cada "ID" representa una vivienda única, pero
> por lo que puede haber más visitas en una misma vivienda, los "ID" están
> duplicados.
> La base visitas es de dimensión: 98692 x 52 (ID duplicados)
> y la base vivienda tendría una dimensión 29866 x 52 (ID únicos).
>
> A partir de la base "visitas", necesito sacar todos los "ID" únicos de la
> última visita en cada vivienda, y pude hacerlo con ese comando:
>
> Base1<- subset(Base_Visitas %>% group_by(enc_idr) %>% summarise(NRO_VISITA
> = max(NRO_VISITA)))
> dim(Base1)
>
> [1] 29866 2
>
> Sin embargo, necesito que me lo expande para todas las 52 variables para
> así realizar otro análisis... Llegué hasta aquí. ¿Me pueden ayudar a
> expandirla para todas las variables, por favor?
> Muchas gracias!!
>
>
>
> --
> *Kendy B.*
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Random search of hyperparameters

2021-02-20 Por tema Carlos Ortega
Hola Manuel,

Mira aquí:

   - https://bradleyboehmke.github.io/HOML/gbm.html

En la sección 12.3.3, justo como hacer un grid search sobre un gbm "a
pelo"...
En secciones posteriores, tienes más ejemplos incluso sobre xgboost.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El sáb, 20 feb 2021 a las 15:16, Manuel Mendoza ()
escribió:

> ¿Conoce alguien un método de optimización de parámetros al azar que no
> utilice caret? Algo parecido a grid search sería ideal.
> for-loops anidados serviría, aunque si no son pocos parámetros puede ser
> engorroso.
> Gracias,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Generar variable con valores repetidos por id

2021-02-15 Por tema Carlos Ortega
Vaya... no incluí la parte del data.frame... para que sea un ejemplo
reproducible...

#



*my_df <- data.frame(  pais_id = rep(1:38, each = 25),
gini = rnorm(25*38))*

library(dplyr)
res_df <- my_df %>%
  group_by(pais_id) %>%
  mutate( gini_avg = mean(gini))
head(res_df)
tail(res_df)

library(data.table)
my_dt <- as.data.table(my_df)
my_dt[ , gini_avg := mean(gini), pais_id]
my_dt
#-

Gracias,
Carlos Ortega
www.qualityexcellence.es


El lun, 15 feb 2021 a las 22:40, Carlos Ortega ()
escribió:

> Hola,
>
> Sí, mira un par de alternativas con un data.frame de ejemplo para simular
> el conjunto de datos equivalente al que tienes..
>
> #-
> library(dplyr)
> res_df <- my_df %>%
>   group_by(pais_id) %>%
>   mutate( gini_avg = mean(gini))
> head(res_df)
> tail(res_df)
>
> library(data.table)
> my_dt <- as.data.table(my_df)
> my_dt[ , gini_avg := mean(gini), pais_id]
> my_dt
> #-
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El lun, 15 feb 2021 a las 16:59, Rolando Valdez ()
> escribió:
>
>> No funciona, solo genera el valor = 1 en las primeras 25 observaciones y
>> NAs en el resto.
>>
>> El dom, 14 de feb. de 2021 a la(s) 22:03, Ivan Corredor castillo (
>> ivangcorred...@gmail.com) escribió:
>>
>> > Buenos días,
>> > Puedes intentar colocando el índice de las filas para cada país 1:25 y
>> el
>> > índice de la columna 1. Los valores que colocó son de ejemplo, tienes
>> que
>> > buscar el índice de las filas y de las columnas para que le asignes los
>> > valores creados por la función.
>> >
>> > db[1:25, 1]<- within(db, {mgini = ave(gini, id)}
>> >
>> > El dom., 14 de febrero de 2021 9:26 p. m., Rolando Valdez <
>> > rvald...@gmail.com> escribió:
>> >
>> >> Estimada comunidad:
>> >>
>> >> Estoy intentando generar una variable con el valor promedio del índice
>> de
>> >> gini en un rango de 25 años para un conjunto de 38 países. Esto en un
>> >> pdata.frame. Sin embargo, necesito que el valor promedio de cada país
>> se
>> >> repita 25 veces en cada uno de estos.
>> >>
>> >> He intentado con la función aggregate tal como sigue:
>> >>
>> >> > db$mgini <- aggregate(db$gini, by = list(db$id), FUN = mean, na.rm =
>> >> TRUE)
>> >> Error in `$<-.data.frame`(x, name, value) :
>> >>   replacement has 38 rows, data has 950
>> >>
>> >> Con este último es que genera un valor para cada país.
>> >>
>> >> Después intenté con la función within, y al parecer sí obtengo el valor
>> >> medio repetido 25 veces en cada país, no obstante, no logro
>> incorporarlo
>> >> en
>> >> el pdata.frame.
>> >>
>> >> > within(db, {mgini = ave(gini, id)})
>> >>
>> >> ¿Alguna sugerencia?
>> >>
>> >> Gracias de antemano.
>> >>
>> >> --
>> >> Rol~
>> >>
>> >> [[alternative HTML version deleted]]
>> >>
>> >> ___
>> >> R-help-es mailing list
>> >> R-help-es@r-project.org
>> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> >>
>> >
>>
>> --
>> Rol~
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Generar variable con valores repetidos por id

2021-02-15 Por tema Carlos Ortega
Hola,

Sí, mira un par de alternativas con un data.frame de ejemplo para simular
el conjunto de datos equivalente al que tienes..

#-
library(dplyr)
res_df <- my_df %>%
  group_by(pais_id) %>%
  mutate( gini_avg = mean(gini))
head(res_df)
tail(res_df)

library(data.table)
my_dt <- as.data.table(my_df)
my_dt[ , gini_avg := mean(gini), pais_id]
my_dt
#-

Gracias,
Carlos Ortega
www.qualityexcellence.es

El lun, 15 feb 2021 a las 16:59, Rolando Valdez ()
escribió:

> No funciona, solo genera el valor = 1 en las primeras 25 observaciones y
> NAs en el resto.
>
> El dom, 14 de feb. de 2021 a la(s) 22:03, Ivan Corredor castillo (
> ivangcorred...@gmail.com) escribió:
>
> > Buenos días,
> > Puedes intentar colocando el índice de las filas para cada país 1:25 y el
> > índice de la columna 1. Los valores que colocó son de ejemplo, tienes que
> > buscar el índice de las filas y de las columnas para que le asignes los
> > valores creados por la función.
> >
> > db[1:25, 1]<- within(db, {mgini = ave(gini, id)}
> >
> > El dom., 14 de febrero de 2021 9:26 p. m., Rolando Valdez <
> > rvald...@gmail.com> escribió:
> >
> >> Estimada comunidad:
> >>
> >> Estoy intentando generar una variable con el valor promedio del índice
> de
> >> gini en un rango de 25 años para un conjunto de 38 países. Esto en un
> >> pdata.frame. Sin embargo, necesito que el valor promedio de cada país se
> >> repita 25 veces en cada uno de estos.
> >>
> >> He intentado con la función aggregate tal como sigue:
> >>
> >> > db$mgini <- aggregate(db$gini, by = list(db$id), FUN = mean, na.rm =
> >> TRUE)
> >> Error in `$<-.data.frame`(x, name, value) :
> >>   replacement has 38 rows, data has 950
> >>
> >> Con este último es que genera un valor para cada país.
> >>
> >> Después intenté con la función within, y al parecer sí obtengo el valor
> >> medio repetido 25 veces en cada país, no obstante, no logro incorporarlo
> >> en
> >> el pdata.frame.
> >>
> >> > within(db, {mgini = ave(gini, id)})
> >>
> >> ¿Alguna sugerencia?
> >>
> >> Gracias de antemano.
> >>
> >> --
> >> Rol~
> >>
> >> [[alternative HTML version deleted]]
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
>
> --
> Rol~
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] from scipy import stats

2021-02-07 Por tema Carlos Ortega
Hola Manuel,

Sí, mira aquí unos ejemplos de XGBoost (en R) usando diferentes
aproximaciones:


   - https://www.shirin-glander.de/2018/11/ml_basics_gbm/

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 7 feb 2021 a las 18:16, Manuel Mendoza ()
escribió:

> Gracias Carlos, la verdad es que me extrañaban varias cosas del código que
> propone. Ahora entiendo.
> He conseguido aplicar un xgboost a un problema de regresión, optimizando
> incluso los hiperparámetros con xgb.cv y expand.grid. Ahora estoy
> intentando aplicarlo para clasificación binaria y multiclase.
> Carlos Ortega ya me mandó algunos ejemplos de aplicación de xgboost pero si
> tú, o algún otro, conoce otros, me serían también de ayuda.
> Un saludo,
> Manuel
>
> El dom, 7 feb 2021 a las 14:53, Carlos A. Crespo ()
> escribió:
>
> > Hola Manuel;
> > Lo que estás viendo es código en Python y por eso no sabés cómo hacerlo
> en
> > R.
> > ¿Qué es lo que necesitas hacer?
> >
> > Saludos,
> >
> > El dom, 7 feb 2021 a las 10:46, Manuel Mendoza (<
> > mmend...@fulbrightmail.org>) escribió:
> >
> >> En la respuesta de la página:
> >>
> >>
> https://stats.stackexchange.com/questions/183984/how-to-use-xgboost-cv-with-hyperparameters-optimization
> >> empieza diciendo:
> >>
> >> from scipy import statsfrom xgboost import XGBClassifierfrom
> >> sklearn.model_selection import RandomizedSearchCV, KFoldfrom
> >> sklearn.metrics import f1_score
> >>
> >> No sé bien lo que es ni cómo se hace.
> >>
> >> ¿alguien me lo podría decir?
> >>
> >> Gracias,
> >>
> >> Manuel
> >>
> >> [[alternative HTML version deleted]]
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Obtener una df a partir de una lista (o algo así)

2021-02-05 Por tema Carlos Ortega
Hola Manuel,

Otra alternativa que se me ocurre es que veas el problema de otra forma.

En vez de usar un caso del ejemplo de la función "xgboost()" en el que
efectivamente las variables de train/test ya tienen una estructura lista
para ser utilizados por xgboost, prueba a crear a partir de un data.frame
las variables de train y test.

Como referencia mira esto:

   -
   https://xgboost.readthedocs.io/en/latest/R-package/xgboostPresentation.html
   - Read the part about "Basic Training using XGBoost" / "Parameter
  variations"
   - O este otro ejemplo más completo:
   -
  https://www.analyticsvidhya.com/blog/2016/01/xgboost-algorithm-easy-steps/

Gracias,
Carlos Ortega
www.qualityexcellence.es

El vie, 5 feb 2021 a las 6:36, Carlos J. Gil Bellosta ()
escribió:

> Hola, ¿qué tal?
>
> Por razones que no vienen al caso y a diferencia de muchos otros tipos de
> modelos tal como se implementan en R, xgboost admite como argumentos la X
> (data) y la Y (label) de tu problema por separado. Son dos objetos
> distintos. agaricus.train es una lista que contiene esos dos objetos (la X
> y la Y); de hecho, una lista es precisamente eso: una estructura que
> permite yuxtaponer otras.
>
> Los dos objetos son, el uno, la matriz agaricus.train$data ---puedes ver
> que se trata de una matriz "sparse" haciendo class(agaricus.train$data) o
> usar las funciones head, etc. para inspeccionarla--- y el otro es un vector
> de números (0 o 1), agaricus.train$label.
>
> Puedes convertir todo en un df tradicional haciendo algo así como
>
> datos <- data.frame(as.matrix(agaricus.train$data), label =
> agaricus.train$label)
>
> Dicho todo lo cual, creo que te vendría bien echarle un buen vistazo a los
> capítulos 2, 3 y 5 de esto <https://datanalytics.com/libro_r/> antes de
> meterte con XGBoost o sufrirás mucho.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
> El vie, 5 feb 2021 a las 6:11, Manuel Mendoza ( >)
> escribió:
>
> > Buenos días, estoy tratando de implementar el código que veis abajo, de
> la
> > documentación del paquete xgboost. Me desconcierta que al cargar las
> bases
> > de datos aparezcan como listas. Cuando la llama directamente al aplicar
> la
> > función xgboost (data = train$data) me desconcierta todavía más. Entiendo
> > que se puede hacer así también, claro. Aunque no aparezca en el
> documento,
> > pretendo componer la df para trabajar desde ella (tal y como acostumbro a
> > hacer) pero, en mi infinita ignorancia, no lo consigo.
> > He probado cosas como:
> > df<-as.data.frame(train),
> > df<-as.data.frame(train$data)
> > y también con as.matrix, pero no funcionan.
> > Si alguien me dice cómo hacerlo (y de paso, por qué) se lo agradecería
> > mucho.
> >
> > library(xgboost)
> > data(agaricus.train, package='xgboost')
> > data(agaricus.test, package='xgboost')
> > train <- agaricus.train
> > test <- agaricus.test
> > bst <- xgboost(data = train$data, label = train$label, max_depth = 2,
> eta =
> > 1, nrounds = 2, objective = "binary:logistic")
> >
> > Gracias, como siempre,
> > Manuel
> >
> > [[alternative HTML version deleted]]
> >
> > _______
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fwd: Asignar color a violin plot por categoria

2021-01-25 Por tema Carlos Ortega
Hola,

Mira este ejemplo, al final que de hecho usa como tu la función
"plot_richness()".


   - https://stackoverflow.com/questions/65876168/violin-plot-color

Gracias,
Carlos Ortega
www.qualityexcellence.es


El lun, 25 ene 2021 a las 22:35, jose luis via R-help-es (<
r-help-es@r-project.org>) escribió:

> puedes probar a añadirle  a tu código:
> +scale_fill_manual(values=c("red", "blue", "black")).
> Obviamente con los colores que te gusten.
> Quizá debas quitar el fill="grey" de arriba, aunque creo que funcionaria
> igual.
>
>
> En lunes, 25 de enero de 2021 21:51:16 CET, Adrian Gonzalez <
> adriangonzalez070...@gmail.com> escribió:
>
>
>
>
> -- Forwarded message -
> From: *Adrian Gonzalez* 
> Date: Sun, Jan 24, 2021 at 12:14 AM
> Subject: Asignar color a violin plot por categoria
> To: 
>
>
> Buen día estimada comunidad,
>
> Tengo el siguiente código:
>
> plot_richness(carbom, "Organism", measures="Shannon") +
> geom_violin(trim=FALSE,  fill="grey") + geom_boxplot(width=0.1,
> fill="white") + labs(title="Alpha Diversity Measure",x="organism",
> y="Shannon Index") + theme_bw() + theme(panel.grid.major = element_blank(),
> panel.grid.minor = element_blank())
>
> Me genera el plot que adjunto, sin embargo quiero tener un color X en cada
> violín, ya probe con varias opciones en fill, por ejemplo fill="blue" o
> fill="red" y colorea el color seleccionado, además, de con palette="blues"
> pero no marca error.
>
> Gracias de antemano,
>
> Saludos cordiales
>
>
> [image: Captura de Pantalla 2021-01-24 a la(s) 0.09.34.png]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] weighted random forest

2021-01-22 Por tema Carlos Ortega
Hola Manuel,

No dan una respuesta concluyente, pero sí algunas pistas...

https://stackoverflow.com/questions/57076570/how-to-calculate-class-weights-for-random-forests

Gracias,
Carlos Ortega
www.qualityexcellence.es

El vie, 22 ene 2021 a las 11:43, Manuel Mendoza ()
escribió:

> Buenos días, tengo una base de datos desequilibrados (unbalanced) en la que
> las ausencias son 9 veces más abundantes que las presencias (*ratio *= 9).
> Para árboles de clasificación utilizo una matriz de pérdidas
> parms=list(loss=matrix(c(0,
> FP,  *ratio  *,0)))o un vector de ponderación que le da 9 veces más peso a
> las presencias. Como cabría esperar, la sensibilidad y sensitividad se
> hacen parecidas. Pasan de ser
> 89/39 a 79/76 y kappa sube de 0.24 a 0.30.
>
> El problema surge cuando intento hacer lo mismo con random forest, y
> supongo que no lo estoy haciendo bien. Uso  RFfit <- randomForest(Dep ~. ,
> classwt = c(1, *ratio * ), data=data). La sensibilidad y sensitividad se
> quedan casi igual 90/40 y kappa también 0.25.
>
> Sé que se puede hacer con ranger, pero, por razones que no vienen al caso,
> no me viene bien cambiar.
>
> Gracias, como siempre,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Error: package or namespace load failed

2021-01-15 Por tema Carlos Ortega
Hola,

Te diría que probaras con otras librerías que no tuvieran la dependencia
con rJava como la tiene "xlsx".
Puedes probar con las de "tidyverse": "readxl" y "writexl".

Y por otro lado, del mensaje de error que adjuntas se ve que tienes la
versión 3.6 de R. Convendría que te actualizaras a la última y con ella
todos los paquetes que tienes instalados. El error también puede venir de
ahí. Aunque estando or medio "rJava" pienso que el error tiene más que ver
con que R llegue bien a ver los paths de Java. Como todo este camino es más
largo, por eso te recomendaba usar esas otras librerías.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El vie, 15 ene 2021 a las 7:20, Manuel Mendoza ()
escribió:

> Buenos días, he instalado xlsx pero, al cargar la librería me da este
> error:
>
> Error: package or namespace load failed for ‘xlsx’:
>  .onLoad failed in loadNamespace() for 'rJava', details:
>   call: inDL(x, as.logical(local), as.logical(now), ...)
>   error: unable to load shared object 'C:/Users/Manuel
> Mendoza/Documents/R/win-library/3.6/rJava/libs/x64/rJava.dll':
>   LoadLibrary failure:  No se encontró el proceso especificado.
>
> Gracias,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] pegar

2021-01-10 Por tema Carlos Ortega
Hola,

Prueba también la opción de tras pegar tu código ir al menú de RStudio:

   - click en "Code"
   - Y en el desplegable que aparece en la parte inferior (teniendo el
   código que acabas de pegar seleccionado) hacer click en "Reformat Code".
  - En Windows la combinación de teclas es "Ctrl + Shift + A".

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 10 ene 2021 a las 17:11, Emilio L. Cano ()
escribió:

> Hola,
> Lo más rápido:
>
> 1. CTRL+A (seleccionar todo)
> 2. CTRL+I (Indentar)
>
> Emilio
>
>
> > El 10 ene 2021, a las 17:00, Jose Betancourt Bethencourt <
> betans...@gmail.com> escribió:
> >
> > Estimados
> >
> > Cuando preparo un script en block de notas o en word, al pegarlo en R
> > Studio me quedan con un gran margen a la izquierda ?Como se evita eso?
> > saludos
> > --
> > Dr. Jose A. Betancourt Bethencourt
> > Universidad de Ciencias Medicas Carlos j. Finlay
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Carlos Ortega
Y tienes más alternativas aquí:

https://www.r-graph-gallery.com/2d-density-plot-with-ggplot2.html

El jue, 7 ene 2021 a las 22:47, Carlos Ortega ()
escribió:

> Hola,
>
> Mira esto:
>
> https://github.com/LKremer/ggpointdensity
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El jue, 7 ene 2021 a las 22:29, Eric ()
> escribió:
>
>> Que tal comunidad, tengo un problema al que le he dado vueltas para
>> resolverlo con R y creo que he llegado a una solución, pero pienso que
>> ya le debe haber pasado a alguien y que ya debe estar implementado en R.
>> SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de la simpleza
>> del problema, al parecer tengo dificultades para describirlo
>> correctamente así es que no doy con su solución en la web. Por eso vengo
>> a preguntarle a inteligencias humanas, a ver si me entienden mejor que
>> las IA de los buscadores XD. El problema es el siguiente:
>>
>> Tengo una matriz con varios miles de filas y dos columnas. Esas dos
>> columnas las represento en un scatterplot que por tener muchos puntos
>> juntos uno al lado, e incluso sobre el otro, se observa como una masa
>> oscura sin una tendencia clara. Sin embargo, tengo un R2 de más de 0.5,
>> así es que tan masa oscura no es, hay alguna tendencia en la relación de
>> las variables, pero no se aprecia gráficamente. De modo que quisiera
>> colorear el gráfico 2D de manera que aquellas zonas con más densidad de
>> puntos sean más rojas y las con menos puntos sean más amarillas, por
>> ejemplo. Pensé crear una tercera columna manualmente para aquellos casos
>> en que haya un punto exactamente sobre otro, pero tengo el problema de
>> que las variables son contínuas, de modo que un punto con exactamente
>> las mismas coordenadas XY es raro, aunque están uno al ladito del otro.
>>
>> Así es que mi pregunta es si hay alguna librería en R que me resuelva el
>> problema de colorear automáticamente el scatterplot de acuerdo a la
>> densidad de puntos de un sector al estilo heatmap (heatmap no me sirve
>> porque requiere que yo indique la tercera componente del gráfico XYZ
>> para colorearlo).
>>
>> Como siempre muchas gracias por su atención y tiempo. Espero dar la mano
>> de vuelta cuando me sea posible.
>>
>> Saludos !!
>>
>> Eric.
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Carlos Ortega
Hola,

Mira esto:

https://github.com/LKremer/ggpointdensity

Saludos,
Carlos Ortega
www.qualityexcellence.es

El jue, 7 ene 2021 a las 22:29, Eric () escribió:

> Que tal comunidad, tengo un problema al que le he dado vueltas para
> resolverlo con R y creo que he llegado a una solución, pero pienso que
> ya le debe haber pasado a alguien y que ya debe estar implementado en R.
> SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de la simpleza
> del problema, al parecer tengo dificultades para describirlo
> correctamente así es que no doy con su solución en la web. Por eso vengo
> a preguntarle a inteligencias humanas, a ver si me entienden mejor que
> las IA de los buscadores XD. El problema es el siguiente:
>
> Tengo una matriz con varios miles de filas y dos columnas. Esas dos
> columnas las represento en un scatterplot que por tener muchos puntos
> juntos uno al lado, e incluso sobre el otro, se observa como una masa
> oscura sin una tendencia clara. Sin embargo, tengo un R2 de más de 0.5,
> así es que tan masa oscura no es, hay alguna tendencia en la relación de
> las variables, pero no se aprecia gráficamente. De modo que quisiera
> colorear el gráfico 2D de manera que aquellas zonas con más densidad de
> puntos sean más rojas y las con menos puntos sean más amarillas, por
> ejemplo. Pensé crear una tercera columna manualmente para aquellos casos
> en que haya un punto exactamente sobre otro, pero tengo el problema de
> que las variables son contínuas, de modo que un punto con exactamente
> las mismas coordenadas XY es raro, aunque están uno al ladito del otro.
>
> Así es que mi pregunta es si hay alguna librería en R que me resuelva el
> problema de colorear automáticamente el scatterplot de acuerdo a la
> densidad de puntos de un sector al estilo heatmap (heatmap no me sirve
> porque requiere que yo indique la tercera componente del gráfico XYZ
> para colorearlo).
>
> Como siempre muchas gracias por su atención y tiempo. Espero dar la mano
> de vuelta cuando me sea posible.
>
> Saludos !!
>
> Eric.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fórmula con variables al azar

2021-01-07 Por tema Carlos Ortega
Hola,

Las diferencias con respecto a un random forest (no sé si usaste
randomForest o ranger) pueden venir del resto de parámetros (los valores
por defecto de rpart están en rpart.control() ) son diferentes a los de
random forest (al menos para los de ranger), por ejemplo número de
elementos a considerar en el split.

Gracias,
Carlos.


El jue, 7 ene 2021 a las 22:12, Manuel Mendoza ()
escribió:

> Gracias José Luis, y también a Carlos y a Juan. Respecto a lo que dices,
> José Luis, de usar un random forest, es que es eso lo que estoy
> programando, un RF. Tenía ya hecho el programa del bootstrap con árboles, y
> a partir de él he programado un RF. He solucionado el problema que tenía
> con lo que me ha dicho Carlos. Funciona bien, aunque me extraña que la
> correlación sobre las muestras OOB no mejore respecto al bootstrap,
> mientras que hecho con el paquete randomForest mejoraba sustancialmente.
> Os lo pongo aquí, tal cual, por si queréis echarle un ojo.
> Un saludo
>
> set.seed(5)
> data <- read.table(file="Data.csv",header=T,sep=",")
>
> colnames(data)
> p=19
> nreps<- 1000
>
> # Creamos una matriz vacía para guardar las predicciones de cada árbol:
> OOBpreds<- matrix(NA, nrow=nrow(data),
> ncol=nreps,dimnames=list(rownames(data)))
>
> target <- c('IFd')
> vars   <- setdiff(names(data), target)
>
> for (i in 1:nreps){
>   selected<-sample(1:nrow(data),size=floor((2/3)*nrow(data)),replace=T)
>   training<- data[selected,]
>   OOB<-data[-selected,]# El out of bag incluye las que no están en
> el training data set
>   num_vars <- floor(p/3)
>   vars_samp <- vars[ sample(1:length(vars), num_vars)]
>   fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse= "+")))
>   fit <- rpart(fmla, data = training)
>   OOBpreds[-selected, i]<-predict(fit, OOB)
>   if(i%%10==0){print(paste("Iteración ",i))} # i%%10==0 significa: el
> resto de dividir i entre 10 es 0
>   }
>
> ResOOB<-rowMeans(OOBpreds, na.rm=T) # se obtiene la media de todas las
> predicciones para cada muestra
> OOBBagging<-lm(data$IFd ~ ResOOB) # para calcular la correlación entre la
> predicción y la observación
> rsqOOBRT<-summary(OOBBagging)$adj.r.squared# R2
>
> windows();plot(data$IFd ~
> ResOOB,main=paste("R2=",round(rsqOOBRT,2)));abline(0,1,lty=2,col=2)
>
>
>
>
>
>
> El jue, 7 ene 2021 a las 11:03, José Luis Cañadas ()
> escribió:
>
>> Hola Manuel.
>> ¿No has pensado en hacer un randomforest, poniendo qeu use todos los
>> datos en cada muestra bootstrap y un porcentaje de las variables?
>>
>> El jue, 7 ene 2021 a las 1:42, Carlos Ortega ()
>> escribió:
>>
>>> Hola Manuel,
>>>
>>> Esta es una forma, uso el conjunto de datos "car90" que viene incluido en
>>> "rpart".
>>>
>>> #-
>>> library(rpart)
>>>
>>> data(car90)
>>> target <- c('Mileage')
>>> vars   <- setdiff(names(car90), target)
>>>
>>> num_loops <- 10
>>> for( i in 1:num_loops) {
>>>num_vars <- 6
>>>vars_samp <- vars[ sample(1:length(vars), num_vars)]
>>>fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse=
>>> "+")))
>>>fit <- rpart(fmla, data = car90)
>>>print(fit)
>>> }
>>>
>>> #-
>>>
>>> Se puede sofisticar esto, para capturar incluso la salida de cada
>>> iteración... :-).
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El mié, 6 ene 2021 a las 22:44, Manuel Mendoza (<
>>> mmend...@fulbrightmail.org>)
>>> escribió:
>>>
>>> > Muy buenas, hago un árbol de regresión (aunque podría ser cualquier
>>> otro
>>> > análisis) dentro de un loop y quiero que en cada vuelta coja un
>>> conjunto
>>> > distinto de variables. En la df hay 19 predictores pero quiero que
>>> utilice
>>> > solo 6 de ellos, al azar, cada vez. ¿Qué debería poner donde hay un
>>> > interrogante?
>>> >
>>> >   fit<- rpart(IFd ~ ? , data=training)
>>> >
>>> > Gracias, como siempre,
>>> > Manuel
>>> >
>>> > [[alternative HTML version deleted]]
>>> >
>>> > ___
>>> > R-help-es mailing list
>>> > R-help-es@r-project.org
>>> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>>> >
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fórmula con variables al azar

2021-01-06 Por tema Carlos Ortega
Hola Manuel,

Esta es una forma, uso el conjunto de datos "car90" que viene incluido en
"rpart".

#-
library(rpart)

data(car90)
target <- c('Mileage')
vars   <- setdiff(names(car90), target)

num_loops <- 10
for( i in 1:num_loops) {
   num_vars <- 6
   vars_samp <- vars[ sample(1:length(vars), num_vars)]
   fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse= "+")))
   fit <- rpart(fmla, data = car90)
   print(fit)
}

#-

Se puede sofisticar esto, para capturar incluso la salida de cada
iteración... :-).

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mié, 6 ene 2021 a las 22:44, Manuel Mendoza ()
escribió:

> Muy buenas, hago un árbol de regresión (aunque podría ser cualquier otro
> análisis) dentro de un loop y quiero que en cada vuelta coja un conjunto
> distinto de variables. En la df hay 19 predictores pero quiero que utilice
> solo 6 de ellos, al azar, cada vez. ¿Qué debería poner donde hay un
> interrogante?
>
>   fit<- rpart(IFd ~ ? , data=training)
>
> Gracias, como siempre,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Proyecto Lucene

2021-01-06 Por tema Carlos Ortega
Hola,

¿No te vale la conexión con SolR?.
SolR y Lucene son ya el mismo proyecto desde 2010...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El mié, 6 ene 2021 a las 23:06, Diego Martín ()
escribió:

> Estimados compañeros:
>
>  He buscado y no he hallado una
> conexión disponible entre R y Lucene. ¿Alguno de ustedes conoce que exista
> como sí la hay con Python [1]?.
>
>   Muchas gracias.
>
> [1] PyLucene.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Crear intervalos

2021-01-05 Por tema Carlos Ortega
Hola,

Sí, el paquete "classInt" permite el cálculo de intervalos usando el método
de Jenks.
También está incluido en el paquete "BAMMTools" (función
"getJenksBreaks()") implementado en C que permite unos tiempos de ejecución
mucho más optimizados.

   - https://cran.r-project.org/web/packages/BAMMtools/index.html
   - Sobre las diferencias de ejecución con respecto a "classInt":
   
https://stackoverflow.com/questions/5304057/partition-into-classes-jenks-vs-kmeans

Y sobre la distancia de Gower y cómo usarlo en Excel, mira esto:

   -
   
https://www.xlstat.com/es/soluciones/funciones/dissimilarity-matrix-for-mixed-data

Saludos,
Carlos Ortega
www.qualityexcellence.es

El mié, 6 ene 2021 a las 8:00, Diego Hernangómez Herrero (<
diego.hernangomezherr...@gmail.com>) escribió:

> Buenas:
>
> Sobre tu primera cuestión, el paquete {classInt} permite obtener intervalos
> sobre una variable bajo diferentes métodos, incluyendo Jenks.
>
> Saludos
>
> El El mié, 6 ene 2021 a las 6:30, ricardo alva 
> escribió:
>
> > Hola amigos buenas noches.
> > Tengo dos consultas, a ver si me pueden ayudar.
> > 1.- Tengo una data de mas de 100 mil valores que representan los ingresos
> > mensuales de una población, los cuales deseo agruparlos en rangos. Como
> los
> > datos son demasiado atípicos, que ni con transformaciones los logros
> > normalizar, he leído en Internet que para estos tipos de datos se pueden
> > establecer sus intervalos a través de los cortes naturales de jenks.
> Sabrán
> > si dicho algoritmo se encuentra en R y como se utiliza?
> >
> > 2.- Alguien sabrá cómo desarrollar la distancia de Gower pero en excel?
> >
> > Agradezco de antemano su apoyo y disculpen la molestia, pero en la web no
> > he podido encontrar algo que me pueda ayudar en lo que necesito.
> >
> > Enviado desde mi Movistar HUAWEI P smart 2019
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> --
>
>
>
> Have a nice day!
>
>     [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ordenar data.frame por fecha en función pivot_wider.

2020-12-14 Por tema Carlos Ortega
Hola,

Puedes crear una nueva variable en la que se convierta los "meses-año" en
eso fechas. Y luego ordenar por ello.
De hecho recientemente lubridate añadió la función para tratar los
"meses-año" con "*my()*".

Also así como:

library(lubridate)

botiquines<-base_agregada_botiquines_anio_mes %>%
  *mutate(mesanio = my(mes_anio)) %>%*
  #group_by(Mes,anio) %>%
  *group_by(mesanio) %>%*
  summarise(botiquines_n = sum(sum_botiquines, na.rm = T)) %>%
  ungroup() %>%
  #group_by(Mes,año) %>%
  *pivot_wider(id_cols="mesanio", names_from=mesanio,
values_from=botiquines_n)*
  #pivot_wider(id_cols="anio",names_from=Mes,values_from=botiquines_n)


Saludos,
Carlos Ortega
www.qualityexcellence.es


El lun, 14 dic 2020 a las 17:46, juan manuel dias ()
escribió:

> Hola, como andan!
>
> Tengo una base con información de envío de botiquines por año y mes. Tengo
> columna año y mes por separado y las quiero unir y transformar a formato
> fecha.
> Lo necesito en formato fecha para poder ordenar el data.frame al aplicar
> función pivot_wider.
>
> botiquines<-base_agregada_botiquines_anio_mes %>%
>   group_by(Mes,año) %>%
>   summarise(botiquines_n = sum(sum_botiquines, na.rm = T)) %>%
>   ungroup() %>%
>   #group_by(Mes,año) %>%
>   pivot_wider(id_cols="año",names_from=Mes,values_from=botiquines_n)
>
> Actualmente el resultado es este:
>
> [image: image.png]
>
> Necesitaría una columna mes-año en formato fecha para que el data-frame de
> salida esté ordenado por esa columna, de modo tal que me quede primero
> 01-2019 segundo 02-2019 y tercero 03-2019, y así suecesivamente etc.
>
> Adjunto csv para que puedan ver los datos.
>
> Muchas gracias!
>
> Juan.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Como puedo reducir el tiempo de ejecución en la siguiente rutina

2020-12-14 Por tema Carlos Ortega
gt; mayor
> > > > >
> > > > > valor por fila tomar el valor de la posición que ocupa la primera
> > > > >
> > > > > columna "Var" en base a la columna elegida y si hay varios valores
> > > > >
> > > > > máximos iguales, entonces ejecutar la función "f5" para elegir una
> y
> > > > >
> > > > > según valor máximo obtenido proceder de la misma manera que antes.
> > > > >
> > > > > El problema es cuando tengo matrices de 3000x3000 o 1x1, y
> > > > >
> > > > > además los dígitos de la columna primera son superiores al puesto
> en
> > este
> > > > >
> > > > > ejemplo, entonces el tiempo de calculo es excesivo.
> > > > >
> > > > > 
> > > > >
> > > > > codigo:
> > > >
> > > > > f5 <- function(x){data1 %>% filter(Clus.Multi.OPTIMO %in%
> > > > >
> > > > > c(EMISOR,RECEPTOR[x])) %>%
> > > > >
> > > > > dplyr::select(1:numvar+1) %>% data.matrix() %>% CohenD()}
> > > > >
> > > > > fila = 1
> > > > >
> > > > > rr = nrow(data2)
> > > > >
> > > > > data1 <- data1 %>% mutate(Clus.Multi.OPTIMO=Clus.Multi.MAX)
> > > > >
> > > > > repeat{
> > > > >
> > > > > smc <-
> > > > >
> > > > >
> >
> sum(data2[fila,((2+fila):(nrow(data2)+2))]==max(data2[fila,((2+fila):(nrow(data2)+2))]))
> > > > >
> > > > > EMISOR <- data2[fila,1]$Var
> > > > >
> > > > > RECEPTOR <-
> > > > >
> > > > >
> >
> data2[which(as.vector(t(data2[fila,])[,1])==max(data2[fila,((2+fila):(nrow(data2)+2))]))-2,1]$Var
> > > > >
> > > > > Rmax <- RECEPTOR[mclapply((1:smc),f5) %>% unlist() %>% which.max()]
> > > > >
> > > > > data1$Clus.Multi.OPTIMO[which(data1$Clus.Multi.MAX ==
> > > > >
> > > > > data2[fila,1]$Var)] <- Rmax
> > > > >
> > > > > fila = fila + 1
> > > > >
> > > > > if (fila == rr) {break}
> > > > >
> > > > > }
> > > >
> > > > >
> >
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> > Libre
> > > > >
> > > > > de virus. www.avast.com
> > > > >
> > > > >
> >
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> > > > >
> > > > > El dom, 13 dic 2020 a las 12:49, Carlos Ortega (
> > c...@qualityexcellence.es)
> > > > >
> > > > > escribió:
> > > > >
> > > > > > Hola,
> > > > > >
> > > > > > Mejor si pones un ejemplo de tu matriz y cuentas lo que quieres
> > hacer...
> > > > > >
> > > > > > El enfoque puede ser muy diferente al que has planteado.
> > > > > >
> > > > > > Gracias,
> > > > > >
> > > > > > Calros Ortega
> > > > > >
> > > > > > www.qualityexcellence.es
> > > > > >
> > > > > > El dom, 13 dic 2020 a las 12:33, Carlos Santos (<
> > > > > >
> > > > > > carlossantos@gmail.com>) escribió:
> > > > > >
> > > > > > > Buen dia,
> > > > > > >
> > > > > > > Tengo un problema cuando ejecuto la siguiente rutina, porque
> con
> > una
> > > > > > >
> > > > > > > matriz
> > > > > > >
> > > > > > > muy grande el tiempo de ejecución se va a bastantes horas.
> > > > > > >
> > > > > > > Cualquier idea para mejorarlo y reducir significativamente el
> > tiempo,
> > > > > > >
> > > > > > > estaría muy agradecido
> > > > > > >
> > > > > > > Muchas gracias por vuestra ayuda
> > > > > > >
> > > > > > >
> >
> #_
> > > > > > >
> > > > > > > f5 <-

Re: [R-es] Como puedo reducir el tiempo de ejecución en la siguiente rutina

2020-12-13 Por tema Carlos Ortega
Hola Carlos,

Vaya, lo siento pero creo que me sigue faltando algo para entenderlo todo...

1. Tienes una primera matriz en la que por fila tienes que elegir la
columna en la que se produce el máximo.
2. Pero si hay dos/o varios valores de máximo, tienes que coger el valor de
"Var" de esa primera matriz y buscarla en la segunda matriz (la imagen que
adjunta) y seleccionar la columna de acuerdo a f5...

Si pones un ejemplo donde haya un único valor de máximo y otro donde hay
que usar esta f5, quedaría ya del todo claro...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 13 dic 2020 a las 15:31, Carlos Santos ()
escribió:

> Perdón Carlos, con las prisas se me olvidó por completo añadir lo que
>> faltaba, tienes toda la razón
>>
>> Supongamos que tenemos esta matriz, se quiere conseguir para el mayor
>> valor por fila tomar el valor de la posición que ocupa la primera
>> columna "Var" en base a la columna elegida y si hay varios valores
>> máximos iguales, entonces ejecutar la función "f5" para elegir una y
>> según valor máximo obtenido proceder de la misma manera que antes.
>>
>> El problema es cuando tengo matrices de 3000x3000 o 1x1, y
>> además los dígitos de la columna primera son superiores al puesto en este
>> ejemplo, entonces el tiempo de calculo es excesivo.
>>
>> [image: image.png]
>>
>> codigo:
>>
>
>
>> f5 <- function(x){data1 %>% filter(Clus.Multi.OPTIMO %in%
>> c(EMISOR,RECEPTOR[x])) %>%
>> dplyr::select(1:numvar+1) %>% data.matrix() %>% CohenD()}
>> #
>> #
>> fila = 1
>> rr = nrow(data2)
>> data1 <- data1 %>% mutate(Clus.Multi.OPTIMO=Clus.Multi.MAX)
>> #
>> repeat{
>> smc <-
>> sum(data2[fila,((2+fila):(nrow(data2)+2))]==max(data2[fila,((2+fila):(nrow(data2)+2))]))
>> EMISOR <- data2[fila,1]$Var
>> RECEPTOR <-
>> data2[which(as.vector(t(data2[fila,])[,1])==max(data2[fila,((2+fila):(nrow(data2)+2))]))-2,1]$Var
>> Rmax <- RECEPTOR[mclapply((1:smc),f5) %>% unlist() %>% which.max()]
>> data1$Clus.Multi.OPTIMO[which(data1$Clus.Multi.MAX ==
>> data2[fila,1]$Var)] <- Rmax
>> fila = fila + 1
>> if (fila == rr) {break}
>> }
>>
>
>
>>
>>
>>
>> <https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail>
>>  Libre
>> de virus. www.avast.com
>> <https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail>
>> <#m_-1660742982892200730_m_-198326376745946536_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>>
>> El dom, 13 dic 2020 a las 12:49, Carlos Ortega ()
>> escribió:
>>
>>> Hola,
>>>
>>> Mejor si pones un ejemplo de tu matriz y cuentas lo que quieres hacer...
>>> El  enfoque puede ser muy diferente al que has planteado.
>>>
>>> Gracias,
>>> Calros Ortega
>>> www.qualityexcellence.es
>>>
>>> El dom, 13 dic 2020 a las 12:33, Carlos Santos (<
>>> carlossantos@gmail.com>) escribió:
>>>
>>>> Buen dia,
>>>>
>>>> Tengo un problema cuando ejecuto la siguiente rutina, porque con una
>>>> matriz
>>>> muy grande el tiempo de ejecución se va a bastantes  horas.
>>>>
>>>> Cualquier idea para mejorarlo y reducir significativamente el tiempo,
>>>> estaría muy agradecido
>>>>
>>>> Muchas gracias por vuestra ayuda
>>>>
>>>>
>>>> #_
>>>>
>>>> f5 <- function(x){data1 %>% filter(Clus.Multi.OPTIMO %in%
>>>> c(EMISOR,RECEPTOR[x])) %>%
>>>> dplyr::select(1:numvar+1) %>% data.matrix() %>% CohenD()}
>>>>
>>>> #
>>>>
>>>> __
>>>>
>>>> fila = 1
>>>> rr = nrow(data2)
>>>>
>>>> repeat{
>>>> smc <-
>>>>
>>>> sum(data2[fila,((2+fila):(nrow(data2)+2))]==max(data2[fila,((2+fila):(nrow(data2)+2))]))
>>>> EMISOR <- data2[fila,1]$Var
>>>> RECEPTOR <-
>>>>
>>>> data2[which(as.vector(t(data2[fila,])[,1])==max(data2[fila,((2+fila):(nrow(data2)+2))]))-2,1]$Var
>>>>
>>>> Rmax <- RECEPTOR[mclapply((1:smc),f5) %>% unlist() %>% which.max()]
>>>>
>>>> data1$Clus.Multi.OPTIMO[which(data1$Clus.Multi.MAX ==
>>>>  data2[fila,1]$Var)] <- Rmax
>>>> fila = fila + 1
>>>> if (fila == rr) {break}
>>>> }
>>>>
>>>> <
>>>> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
>>>> >
>>>> Libre
>>>> de virus. www.avast.com
>>>> <
>>>> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
>>>> >
>>>> <#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Como puedo reducir el tiempo de ejecución en la siguiente rutina

2020-12-13 Por tema Carlos Ortega
Hola,

Mejor si pones un ejemplo de tu matriz y cuentas lo que quieres hacer...
El  enfoque puede ser muy diferente al que has planteado.

Gracias,
Calros Ortega
www.qualityexcellence.es

El dom, 13 dic 2020 a las 12:33, Carlos Santos ()
escribió:

> Buen dia,
>
> Tengo un problema cuando ejecuto la siguiente rutina, porque con una matriz
> muy grande el tiempo de ejecución se va a bastantes  horas.
>
> Cualquier idea para mejorarlo y reducir significativamente el tiempo,
> estaría muy agradecido
>
> Muchas gracias por vuestra ayuda
>
>
> #_
>
> f5 <- function(x){data1 %>% filter(Clus.Multi.OPTIMO %in%
> c(EMISOR,RECEPTOR[x])) %>%
> dplyr::select(1:numvar+1) %>% data.matrix() %>% CohenD()}
>
> #
>
> __
>
> fila = 1
> rr = nrow(data2)
>
> repeat{
> smc <-
>
> sum(data2[fila,((2+fila):(nrow(data2)+2))]==max(data2[fila,((2+fila):(nrow(data2)+2))]))
> EMISOR <- data2[fila,1]$Var
> RECEPTOR <-
>
> data2[which(as.vector(t(data2[fila,])[,1])==max(data2[fila,((2+fila):(nrow(data2)+2))]))-2,1]$Var
>
> Rmax <- RECEPTOR[mclapply((1:smc),f5) %>% unlist() %>% which.max()]
>
> data1$Clus.Multi.OPTIMO[which(data1$Clus.Multi.MAX ==
>  data2[fila,1]$Var)] <- Rmax
> fila = fila + 1
> if (fila == rr) {break}
> }
>
> <
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> Libre
> de virus. www.avast.com
> <
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> <#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>
>     [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] En R.4.03 no corre el comando plot.design

2020-12-10 Por tema Carlos Ortega
Hola,

Puedes hacerlo de varias formas:


   - Lo cambias al vuelo en el propio plot.design.
  - plot.design( PESO ~* as.factor(TRATAMIENTO)*, data=Prueba,
  ylab="PESO", col.lab="blue", col.axis="red", cex.axis=0.4)


   - O, primeramente lo transformas en tu datos y luego ya lo incluyes en
   plot.design()
  - *Prueba$TRATAMIENTO <- factor(Prueba$TRATAMIENTO)*
  - plot.design( PESO ~ TRATAMIENTO, data=Prueba, ylab="PESO",
  col.lab="blue", col.axis="red", cex.axis=0.4)



El jue, 10 dic 2020 a las 10:44, Juan Bautista ()
escribió:

> Muchas gracias Carlos.
>
> Efectivamente lo he comprobado …y tienes razón.
>
> La columna “TRATAMIENTO” no me la lee como “Factor” si no como “Character”.
>
> Estoy intentando cambiar para que me aparezca como “Factor” Dos formas que
> he probado no me han funcionado. Alguna sugerencia?
>
> Gracias Otra vez
>
>
>
>
>
> Un saludo.
>
> *Juan Bautista Relloso Barrio*
>
> Coordinador de Equipos e Infraestructuras | Técnico de Cultivos del
> Departamento de Producción Vegetal
>
> Talde eta Azpiegitura Koordinatzailea | Laborantza teknikaria Landare
> Ekoizpen Departamentua
>
> jbauti...@neiker.eus | M. 688 62 98 14
>
> *www.neiker.eus* <http://www.neiker.eus/>
> <https://www.linkedin.com/company/neiker/>
> <https://twitter.com/neiker_BRTA> <https://www.facebook.com/neikerBRTA>
> <https://www.youtube.com/user/neikertec>
>
> *[image: ej_ekonomia_garapen_lateral] * [image:
> https://www.emakunde.euskadi.eus/contenidos/informacion/violencia_puntolila/eu_def/adjuntos/punto.lila.jpg]
>
>
>
> PRIBATUTASUN POLITIKA <https://neiker.eus/eu/pribatutasun-politika/> | 
> POLÍTICA
> DE PRIVACIDAD <https://neiker.eus/es/politica-privacidad/> | LEGAL NOTICE
> <https://neiker.eus/en/privacy-policy/>
>
>
>
> *De:* Carlos Ortega 
> *Enviado el:* jueves, 10 de diciembre de 2020 10:17
> *Para:* Juan Bautista 
> *CC:* Proyecto R-UCA ; r-help-es@r-project.org
> *Asunto:* Re: [R-es] En R.4.03 no corre el comando plot.design
>
>
>
> Hola,
>
>
>
> Desde la 4.0 R al importar un dataset, ya no convierte los "strings" a
> "factors" y ese es el error que tienes. Sospecho que la columna
> "TRATAMIENTO" no es factor y aparece el error.
>
> Comprueba la clase de las columnas en la 3.63 antes de entrar en el plot y
> lo mismo con la 4.03.
>
>
>
> Gracias,
>
> Carlos Ortega
>
> www.qualityexcellence.es
>
>
>
> El jue, 10 dic 2020 a las 10:02, Juan Bautista ()
> escribió:
>
> Hola a todos.
> Acabo de instalar la versión de R 4.03 y hay un comando que no corre. Me
> dá un mensaje de error que no se descifrar
> Este es el comando:
> plot.design( PESO ~ TRATAMIENTO, data=Prueba, ylab="PESO", col.lab="blue",
> col.axis="red", cex.axis=0.4)
> Y el mensaje de error que me da es este:
> Error in .plot.des(xf, ydata[, j], fun = fun, ylab = ylab[j], ylim =
> ylim,  :
>   all columns/components of 'x' must be factors
>
> Lo que me fastidia es que el mismo comando sin cambiar nada en R 3.63
> corre perfectamente sin ningún problema
> ¿Puede que me falte algún paquete o librería de cargar?
>
> Un saludo.
> Juan Bautista Relloso Barrio
> Coordinador de Equipos e Infraestructuras | Técnico de Cultivos del
> Departamento de Producción Vegetal
> Talde eta Azpiegitura Koordinatzailea | Laborantza teknikaria Landare
> Ekoizpen Departamentua
> jbauti...@neiker.eus | M. 688 62 98 14
> www.neiker.eus
>
>
> PRIBATUTASUN POLITIKA | POLÍTICA DE PRIVACIDAD | LEGAL NOTICE
>
> -Mensaje original-
> De: R-help-es  En nombre de Proyecto
> R-UCA
> Enviado el: viernes, 27 de noviembre de 2020 10:08
> Para: r-help-es@r-project.org
> Asunto: Re: [R-es] Cargar data frame en app shiny
>
> Hola:
>
> ¿Has comprobado los permisos de las carpetas padre?
>
> Ten en cuenta que shiny tal vez se esté ejecutando por algún usuario de
> sistema con privilegios restringidos como www-data o similar.
>
> Un saludo.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
> --
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] En R.4.03 no corre el comando plot.design

2020-12-10 Por tema Carlos Ortega
Hola,

Desde la 4.0 R al importar un dataset, ya no convierte los "strings" a
"factors" y ese es el error que tienes. Sospecho que la columna
"TRATAMIENTO" no es factor y aparece el error.
Comprueba la clase de las columnas en la 3.63 antes de entrar en el plot y
lo mismo con la 4.03.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue, 10 dic 2020 a las 10:02, Juan Bautista ()
escribió:

> Hola a todos.
> Acabo de instalar la versión de R 4.03 y hay un comando que no corre. Me
> dá un mensaje de error que no se descifrar
> Este es el comando:
> plot.design( PESO ~ TRATAMIENTO, data=Prueba, ylab="PESO", col.lab="blue",
> col.axis="red", cex.axis=0.4)
> Y el mensaje de error que me da es este:
> Error in .plot.des(xf, ydata[, j], fun = fun, ylab = ylab[j], ylim =
> ylim,  :
>   all columns/components of 'x' must be factors
>
> Lo que me fastidia es que el mismo comando sin cambiar nada en R 3.63
> corre perfectamente sin ningún problema
> ¿Puede que me falte algún paquete o librería de cargar?
>
> Un saludo.
> Juan Bautista Relloso Barrio
> Coordinador de Equipos e Infraestructuras | Técnico de Cultivos del
> Departamento de Producción Vegetal
> Talde eta Azpiegitura Koordinatzailea | Laborantza teknikaria Landare
> Ekoizpen Departamentua
> jbauti...@neiker.eus | M. 688 62 98 14
> www.neiker.eus
>
>
> PRIBATUTASUN POLITIKA | POLÍTICA DE PRIVACIDAD | LEGAL NOTICE
>
> -Mensaje original-
> De: R-help-es  En nombre de Proyecto
> R-UCA
> Enviado el: viernes, 27 de noviembre de 2020 10:08
> Para: r-help-es@r-project.org
> Asunto: Re: [R-es] Cargar data frame en app shiny
>
> Hola:
>
> ¿Has comprobado los permisos de las carpetas padre?
>
> Ten en cuenta que shiny tal vez se esté ejecutando por algún usuario de
> sistema con privilegios restringidos como www-data o similar.
>
> Un saludo.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Error CLUSTER : no se puede ubicar un vector de tamaño 1.7 gb

2020-11-27 Por tema Carlos Ortega
Hola,

Una duda parecida apareció hace mucho tiempo en esta lista...(2015)

https://www.mail-archive.com/r-help-es@r-project.org/msg02143.html

Aunque tengas 8Gb de RAM, seguramente no toda esta RAM esté disponible.
En esa respuesta tienes varias sugerencias de cómo proceder.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue, 26 nov 2020 a las 15:58, Maicol Santos Anchia (<
msantos1...@hotmail.com>) escribió:

> Buenas Estimados:
>
> Quería saber si me pueden ayudar por favor.
>
> Estaba tratando de generar  cluster´s con un set de datos que tengo.Es un
> set de datos de unas 100 mil filas, y 16 columnas (son datos reales)
>
> Pero me aparece el siguiente error: "ERROR no se puede ubicar un vector de
> tamaño 1,7 Gb”.
>
> Además, Busque un poco en internet sobre unas librerías para realizar el
> algoritmo de matriz de distancias, sin embargo, me arroja diferentes
> errores y después me vuelve a mostrar el mismo error del tamaño del vector
>
> abajo el Código de la Librería.
>
> Library(factorextra)
>
> df = read_csv(“ruta”)
>
> mtrx.dist = scale(df[,1:2])
>
> fviz_dist(mtrx.dist, gradient = list(low = "blue", mid = "white", high =
> "red"))
>
>
> Error in fviz_dist(mtrx.dist, gradient = list(low = "blue", mid = "white",
> : no se pudo encontrar la función "fviz_dist"
>
>
> Tengo un equipo de 8 RAM y 8 núcleos. ¿Qué puede estar pasando? ¿cómo lo
> puedo solucionar?
>
> De antemano muchas gracias
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cambiar nombre de topic en análisis LDA

2020-11-24 Por tema Carlos Ortega
Hola Miriam,

Además de lo que te comenta Emilio, después del "ungroup()" puedes
introducir una sentencia con un "mutate()" para que transforme cada
elemento del "topic" por la cadena que quieras.
Por no hacerlo en el "mutate()" que ya existe y ver el efecto más claro.
Consistiría en usar una sentencia del tipo "str_replace_all()" donde
cambiarías "1" por el nombre que quisieras, y así para el 2 y el 3...

Saludos,
Carlos Ortega
www.qualityexcellence.es


El mar, 24 nov 2020 a las 14:38,  escribió:

> Buenas tardes
>
> Estoy haciendo un análisis LDA y me gustaría cambiar el nombre de los
> topics a la hora de visualizarlos y en vez de que se llamen 1,2,3...darles
> un nombre. ¿Es posible en este código?
>
> lda22 <- LDA(reviews_dtm, k = 22, control = list(seed = 1234))
>
> lda22 %>%
>   tidy() %>%
>   group_by(topic) %>%
>   top_n(10, beta) %>%
>   ungroup() %>%
>   mutate(term = reorder_within(term, beta, topic)) %>%
>   ggplot(aes(term, beta, fill = factor(topic))) +
>   geom_col(show.legend = FALSE) +
>   facet_wrap(~ topic, scales = "free_y") +
>   coord_flip() +
>   scale_x_reordered()
>
> Muchas gracias
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] No mostrar standad errors con Stargazer

2020-11-19 Por tema Carlos Ortega
Hola,

Mira el detalle del parámetro "se" de la función, porque parece que si lo
defines con NULL lo evitas.

se=list(NULL, robust.se)


El jue, 19 nov 2020 a las 21:23,  escribió:

> Hola Carlos,
>
> Sí, pero veo que es para incluir "robust standard errors" pero no consigo
> el código para que no incluya ninguno.
>
> Gracias!
>
> El Jue, 19 de Noviembre de 2020, 20:44, Carlos Ortega escribió:
> > Hola Miriam,
> >
> > ¿Has visto el punto "2.2 Including Custom Standard Errors" de la viñeta
> > del
> > paquete?.
> >
> > Gracias,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
> > El jue, 19 nov 2020 a las 14:05,  escribió:
> >
> >> Buenas tardes,
> >>
> >> Quiero representar los resultados de una regresión con la librería
> >> Stargazer pero no se cómo hacer para que no me reporte los standard
> >> errors. Este es el código:
> >>
> >> stargazer(Model 1, Model 2,type = "html", digits = 2, title = "Model
> >> comparison (count)",out = "Modelcomparison.htm")
> >>
> >> ¿Qué tendría que señalar en el código?
> >>
> >> Muchas gracias
> >>
> >> Miriam
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >
> > --
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
>
>
>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Trabajar con fechas y data.table

2020-11-14 Por tema Carlos Ortega
Hola,

No, sigo usando normalmente "lubridate".
Pero cada vez más "anytime".

https://cran.r-project.org/web/packages/anytime/vignettes/anytime-introduction.pdf

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom., 15 nov. 2020 a las 8:31, Jesús Para Fernández (<
j.para.fernan...@hotmail.com>) escribió:

> Cosas como IDate están aún en modo experimental, haces uso de esas
> funciones?
>
> Obtener Outlook para Android <https://aka.ms/ghei36>
> ------
> *From:* Carlos Ortega 
> *Sent:* Sunday, November 15, 2020 8:27:43 AM
> *To:* Jesús Para Fernández 
> *Cc:* r-help-es@r-project.org 
> *Subject:* Re: [R-es] Trabajar con fechas y data.table
>
> Hola Jesús,
>
> Sí, sí existen ya funciones propias de data.table para esto.
> Mira esta página con todas las funciones disponibles en data.table, al
> principio están todas las relacionadas con fechas:
>
> https://rdatatable.gitlab.io/data.table/reference/index.html
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El dom., 15 nov. 2020 a las 7:56, Jesús Para Fernández (<
> j.para.fernan...@hotmail.com>) escribió:
>
> Buenas
>
> Para trabajar con fechas suelo apoyarme en el paquete lubridate, pero me
> gustaria ver si hay algo en data.table que me permita quitar esa
> dependencia. ¿Existe algo parecido?
>
> Gracias!
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Trabajar con fechas y data.table

2020-11-14 Por tema Carlos Ortega
Hola Jesús,

Sí, sí existen ya funciones propias de data.table para esto.
Mira esta página con todas las funciones disponibles en data.table, al
principio están todas las relacionadas con fechas:

https://rdatatable.gitlab.io/data.table/reference/index.html

Gracias,
Carlos Ortega
www.qualityexcellence.es


El dom., 15 nov. 2020 a las 7:56, Jesús Para Fernández (<
j.para.fernan...@hotmail.com>) escribió:

> Buenas
>
> Para trabajar con fechas suelo apoyarme en el paquete lubridate, pero me
> gustaria ver si hay algo en data.table que me permita quitar esa
> dependencia. ¿Existe algo parecido?
>
> Gracias!
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Resultado de la consola como un tibble

2020-10-18 Por tema Carlos Ortega
Hola,

No hace falta (en este caso) capturarlo de la consola.
El resultado de la función apply se puede capturar y procesar.

> data("mtcars")
> # Mtcars_matriz <- as.matrix(mtcars)
> res_out <- apply(mtcars, MARGIN =2, FUN = shapiro.test)
>
>
> res_df <- as.data.frame(unlist(res_out))
> res_df$vars <- rownames(res_df)
> rownames(res_df) <- NULL
> names(res_df)[1] <- c('values')
>
> library(stringr)
> res_fin <- data.frame(
+   pvalues = res_df[ str_detect(res_df$vars, "value"), ],
+   estadis = res_df[ str_detect(res_df$vars, "statistic"), ]
+ )
> res_fin
 pvalues.values pvalues.varsestadis.values estadis.vars
2 0.122881358539443  mpg.p.value 0.947564726479274  mpg.statistic.W
6  6.05833813310341e-06  cyl.p.value 0.753310022842721  cyl.statistic.W
10   0.0208065696108598 disp.p.value 0.920012680133146 disp.statistic.W
14   0.0488082381051741   hp.p.value  0.93341934019855   hp.statistic.W
180.110060757426683 drat.p.value 0.945883896521269 drat.statistic.W
22   0.0926549888932132   wt.p.value 0.943257719087817   wt.statistic.W
260.593517649295161 qsec.p.value 0.973250948857977 qsec.statistic.W
30 9.73737573091618e-08   vs.p.value 0.632263534949347   vs.statistic.W
34 7.83635448813453e-08   am.p.value 0.625074366031524   am.statistic.W
38 1.30684376520844e-05 gear.p.value 0.772785633173186 gear.statistic.W
42 0.000438240495931375 carb.p.value 0.851097225173946 carb.statistic.W

Saludos,
Carlos Ortega
www.qualityexcellence.es


El dom., 18 oct. 2020 a las 7:12, Jimmy Erney Reyes Velasco (<
jimmyreyesvela...@gmail.com>) escribió:

> Buen día
> estimados
> Estoy tratando de hacer un tibble con los resultados de un apply que se
> muestran en la consola que me da R, no estoy seguro si eso se pueda hacer,
> pero me gustaría organizar los resultados de esa manera.
> mi código es:
> data("mtcars")
> Mtcars_matriz <- as.matrix(mtcars)
> apply(Mtcars_matriz, MARGIN =2, FUN = shapiro.test)
> DF2 <- tibble(Variable = NA, W = NA, Pvalue = NA)
>
> la idea es que me guarde el nombre de la variable, el valor del estadístico
> y el pvalor.
>
> ¿alguien sabe si esto se puede hacer?
> agradezco mucho su información
> saludos
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Vectores de impedancia bioeléctrica

2020-10-16 Por tema Carlos Ortega
Hola,

La propia lista filtra los adjuntos si superan cierto tamaño...
No veo la figura/artículo que adjuntas.

Gracias,
Carlos Ortega
www.qualityexcellence.es


El vie., 16 oct. 2020 a las 13:30, Jose Betancourt Bethencourt (<
betans...@gmail.com>) escribió:

> Estimados
> En este artículo que adjunto Vectores de impedancia bioeléctrica, en
> la fig 1 hay un gráfico que realizan en un programa, mi pregunta es si
> en R se puede calcular, si esto se relaciona a biplot, por favor
> necesito de su ayuda
> Saludos
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Leyenda gráfico combinado

2020-10-04 Por tema Carlos Ortega
Hola,

Usando el paquete que comentaba y cogiendo el data.frame con el paquete
"datapasta"...
He aplicado un ajuste polinómico de grado 3.

#
library(data.table)
library(ggplot2)

datIn <- data.table(
  Individuo = c(1L,2L,3L,4L,5L,6L,7L,8L,9L,10L,
11L,12L,13L,14L,15L,16L,17L,18L,19L,20L,21L,22L,23L,
24L,25L,26L,27L,28L,29L,30L),
  Observada = c(200.21,154.817,514.919,234.068,232.191,
379.53,297.466,450.94,317.84,308.16,178.317,530.919,
368.224,251.352,154.866,309.39,291.637,513.398,322.25,
451.932,612.163,574.745,92.629,451.836,449.408,689.179,
885.454,484.617,876.734,506.156),
  Estimada = c(180.75719,110.00147,455.28532,226.17628,
   218.58544,346.95982,309.05514,421.53012,276.81604,
   305.13638,182.79552,492.87962,347.28844,255.40259,143.53278,
   307.57602,288.5641,454.39712,323.53048,442.87195,555.30366,
   518.25317,56.79211,413.1442,445.26074,741.37221,735.90541,
   450.47909,742.06702,521.66028)
)

datIn_lg <- melt(datIn, id=1)
names(datIn_lg) <- c('Individuo', 'Tipo', 'Valor')

library(ggpmisc)
formula <- y ~ poly(x, 3, raw = TRUE)
ggplot(datIn_lg, aes( Individuo, Valor, group = Tipo, color = Tipo)) +
  geom_point() +
  geom_smooth(method = "lm", formula = formula) +
  stat_poly_eq(aes(label =  paste(stat(eq.label), stat(adj.rr.label),
  sep = "*\", \"*")),
   formula = formula, parse = TRUE) +
  labs(x = expression(italic(x)), y = expression(italic(y))) +
  facet_wrap(~Tipo) +
  theme_bw()
#

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 4 oct. 2020 a las 23:16, Jimmy Erney Reyes Velasco (<
jimmyreyesvela...@gmail.com>) escribió:

> Lo siento creo que olvide poner los datos.
> mis datos son:
>
> Individuo Observada Estimada
> 1 200.210 180.75719
> 2 154.817 110.00147
> 3 514.919 455.28532
> 4 234.068 226.17628
> 5 232.191 218.58544
> 6 379.530 346.95982
> 7 297.466 309.05514
> 8 450.940 421.53012
> 9 317.840 276.81604
> 10 308.160 305.13638
> 11 178.317 182.79552
> 12 530.919 492.87962
> 13 368.224 347.28844
> 14 251.352 255.40259
> 15 154.866 143.53278
> 16 309.390 307.57602
> 17 291.637 288.5641
> 18 513.398 454.39712
> 19 322.250 323.53048
> 20 451.932 442.87195
> 21 612.163 555.30366
> 22 574.745 518.25317
> 23 92.629 56.79211
> 24 451.836 413.1442
> 25 449.408 445.26074
> 26 689.179 741.37221
> 27 885.454 735.90541
> 28 484.617 450.47909
> 29 876.734 742.06702
> 30 506.156 521.66028 por otro lado intenté poner la ecuación para un
> modelo potencial pero no pude, no pude saber cómo escribir el argumento
> para la fórmula.
>
> El dom., 4 de oct. de 2020 a la(s) 14:09, Carlos Ortega (
> c...@qualityexcellence.es) escribió:
>
>> Hola,
>>
>> Además de la alternativa de Emilio, como estás buscando incluir una
>> fórmula y el valor de ajuste sobre el gráfico, quizás te interese usar las
>> funcionalidades de este paquete:
>>
>>- *ggpmisc*:
>>https://cran.r-project.org/web/packages/ggpmisc/vignettes/user-guide.html
>>- Y en particular la función *stat_poly_eq()*.
>>- Puedes ver ejemplos prácticos de esta función sobre a mitad de la
>>   viñeta.
>>   - Y que por cierto, permite además ajuste y representación del
>>   tipo *nls()* sobre tus datos .
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El dom., 4 oct. 2020 a las 16:07, Jimmy Erney Reyes Velasco (<
>> jimmyreyesvela...@gmail.com>) escribió:
>>
>>> Hola buenos días
>>> hice un gráfico combinado de líneas, puntos y barras en ggplot2, pero no
>>> sé
>>> cómo puedo poner la leyenda de eso gráfico para que me represente para
>>> las
>>> líneas con puntos los valores estimados por un modelo y observados.
>>> este es mi código:
>>> ggplot(MLM,aes(x=Individuo)) + geom_bar(aes(y=Observada), stat =
>>> "identity", color= "gray") +
>>>   geom_line(aes(y=Estimada), stat = "identity", color="blue", size=1.5) +
>>>   geom_point(aes(y=Estimada), shape=21, fill="blue", color="white")+
>>>   labs(y = expression(paste("Biomasa ", (g/cm^{2}+
>>>   ggtitle("Espeletia standleyana")+ theme_minimal()+
>>>   annotate(geom = 'text',
>>>x = 0,
>>>y = 750,
>>>hjust = 0,
>>>label = "Biomasa=220,774(IAF)+39,759(Aprom)-163,883")+
&g

Re: [R-es] Leyenda gráfico combinado

2020-10-04 Por tema Carlos Ortega
Hola,

Además de la alternativa de Emilio, como estás buscando incluir una fórmula
y el valor de ajuste sobre el gráfico, quizás te interese usar las
funcionalidades de este paquete:

   - *ggpmisc*:
   https://cran.r-project.org/web/packages/ggpmisc/vignettes/user-guide.html
   - Y en particular la función *stat_poly_eq()*.
   - Puedes ver ejemplos prácticos de esta función sobre a mitad de la
  viñeta.
  - Y que por cierto, permite además ajuste y representación del tipo
  *nls()* sobre tus datos .

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 4 oct. 2020 a las 16:07, Jimmy Erney Reyes Velasco (<
jimmyreyesvela...@gmail.com>) escribió:

> Hola buenos días
> hice un gráfico combinado de líneas, puntos y barras en ggplot2, pero no sé
> cómo puedo poner la leyenda de eso gráfico para que me represente para las
> líneas con puntos los valores estimados por un modelo y observados.
> este es mi código:
> ggplot(MLM,aes(x=Individuo)) + geom_bar(aes(y=Observada), stat =
> "identity", color= "gray") +
>   geom_line(aes(y=Estimada), stat = "identity", color="blue", size=1.5) +
>   geom_point(aes(y=Estimada), shape=21, fill="blue", color="white")+
>   labs(y = expression(paste("Biomasa ", (g/cm^{2}+
>   ggtitle("Espeletia standleyana")+ theme_minimal()+
>   annotate(geom = 'text',
>x = 0,
>y = 750,
>hjust = 0,
>label = "Biomasa=220,774(IAF)+39,759(Aprom)-163,883")+
>   annotate(geom = 'text',
>x = 0,
>y = 700,
>hjust = 0,
>label = "R² = 0,982  P=3,8187E-17")
>
> ¿Alguien sabe cómo hacerlo? Agradezco mucho cualquier información.
> que tengan buen día
>
> <
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> Libre
> de virus. www.avast.com
> <
> https://www.avast.com/sig-email?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> <#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] GRÁFICO DE BARRAS COMPARATIVO VARIOS AÑOS

2020-09-28 Por tema Carlos Ortega
Hola Jesús,

Yo pondría los tres grupos en el mismo data.frame (de forma tidy) y con una
columna que indicara el "mes".
Y es esta nueva columna la que agruparía en aes() como aparece destacado en
el código adjunto.

#---
Orden_barras <- c("ENE","FEB","MAR","ABR","MAY","JUN",
  "JUL","AGO","SEP","OCT","NOV","DIC") # VECTOR ORD BARRAS
ggplot(Diario_S2, aes(x=factor(mes_AAA, level = Orden_barras),
y=USD_HAB, *group
= mes* ))+ # ASIGNAR VARIABLES
geom_bar(stat="identity", width=0.7,   # ANCHO BARRAS
 colour="grey", fill="darkred", # COLOR (borde relleno)
 position = "dodge")+
labs(x="MESES",  y="IMPORTES EN USD",color="Tipo")+ # TITULOS EJES
ggtitle("VALORES AL HABER POR MES EN USD (HISTÓRICOS")#TIT GRAFICO
#---

Saludos,
Carlos Ortega
www.qualityexcellence.es

El lun., 28 sept. 2020 a las 0:49, Jesus MARTIN F. ()
escribió:

>Buenas noches,
>
>Tengo que preparar un gráfico de barras comparativo para varios años, en
> el que tenga agrupadas, 3 barras para enero, 3 barras para febrero, 3
> barras para marzo y así sucesivamente para todos los meses, estando en cada
> mes, los años 2020, 2019 y 2018 (juntas), un pequeño espacio y luego las de
> febrero y así sucesivamente...
>
>Con el siguiente código, hago un año:
>
> ##
> ## GRAFICO BARRAS : VALORES AL HABER MENSUALIZADO EN USD EJERCICIO EN CURS
> Orden_barras <- c("ENE","FEB","MAR","ABR","MAY","JUN",
>   "JUL","AGO","SEP","OCT","NOV","DIC") # VECTOR ORD BARRAS
> ggplot(Diario_S2, aes(x=factor(mes_AAA, level = Orden_barras),
>   y=USD_HAB))+ # ASIGNAR VARIABLES
> geom_bar(stat="identity", width=0.7,   # ANCHO BARRAS
>  colour="grey", fill="darkred", # COLOR (borde relleno)
>  position = "dodge")+
> labs(x="MESES",  y="IMPORTES EN USD",color="Tipo")+ # TITULOS EJES
> ggtitle("VALORES AL HABER POR MES EN USD (HISTÓRICOS")#TIT GRAFICO
> ##
>
>   Los Datasets que tengo, son Diario_S2 para 2020, Dia_S2_19 para 2019 y
> Dia_S2_18 para 2018. Es decir que tengo un Dataset para cada año.
>
>   Solicito ayuda para hacer el comparativo, todo en un sólo gráfico de la
> manera planteada al principio.
>
>   Muchas gracias,
>
> _
>
> *Jesús MARTÍN FRADE *
> Skype:jmfpas
> Tel (celular):(011) 154-946-2131 (Argentina)
> (+54) 911-4946-2131 (Internacional)
> Facebook http://www.facebook.com/jesusmartinfrade
>
> [image: Mailtrack]
> <
> https://mailtrack.io?utm_source=gmail_medium=signature_campaign=signaturevirality5;
> >
> Remitente
> notificado con
> Mailtrack
> <
> https://mailtrack.io?utm_source=gmail_medium=signature_campaign=signaturevirality5;
> >
> 27/09/20
> 19:46:01
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] expresiones regulares

2020-09-20 Por tema Carlos Ortega
Hola,

Extraer los tres primeros caracteres de cada cadena se puede hacer así:

> library(stringr)
>
> mis_str <-
c('1.3ptd','1.3ptdm','4.4ptdm23j','7.716s','1.4hola','1.4hola.hola','5.5v6','5.5v6sdp','5.5v10sdp')
>
> res_out <- vector()
> for(i in 1:length(mis_str)) {
+   wrd_tmp <- mis_str[i]
+   pri_parte <- str_sub(wrd_tmp, 1, 3)
+   sec_parte <- str_sub(wrd_tmp, 4, nchar(wrd_tmp))
+   res_tmp <- c(pri_parte,sec_parte)
+   res_out <- c(res_out, res_tmp)
+ }
>
> paste0(res_out, collapse = " ")
[1] "1.3 ptd 1.3 ptdm 4.4 ptdm23j 7.7 16s 1.4 hola 1.4 hola.hola 5.5 v6 5.5
v6sdp 5.5 v10sdp"
>

Pero es que este es el patrón claro que veo de primeras. Hay algún otro
patrón más... sobre lo que se guarda en "sec_parte", pero siguiendo esta
idea puedes tratarlo.

Saludos,
Carlos Ortega
www.qualityexcellence.es


El dom., 20 sept. 2020 a las 17:43, Samura . ()
escribió:

> Hola a tod@s
>
> ¿alquien sabria como convertir estas frases con expresiones regulares?
>
> 1.3ptd  -> 1.3 ptd
> 1.3ptdm -> 1.3 ptdm
> 4.4ptdm23j -> 4.4 ptdm 23j
> 7.716s -> 7.7 16s
> 1.4hola -> 1.4 hola
> 1.4hola.hola -> 1.4 hola.hola
> 5.5v6  -> 5.5 v6
> 5.5v6sdp  -> 5.5 v6 sdp
> 5.5v10sdp  -> 5.5 v10 sdp
>
> de forma que esta frase
>
> "hola 1.3ptd 1.3ptdm 4.4ptdm23j 7.716s 1.4hola pepe 1.4hola.hola 5.5v6
> 5.5v6sdp 5.5v10sdp"
>
>
> quedara así
>
> "hola 1.3 ptd 1.3 ptdm 4.4 ptdm 23j 7.7 16s 1.4 hola pepe 1.4 hola.hola
> 5.5 v6 5.5 v6 sdp 5.5 v10 sdp"
>
> estoy probando con gsub y no doy con la tecla.
>
> Lo mismo hay una forma mas simple de cambiarlo y no usando las expresiones
> regulares.
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] aplicar codigo

2020-09-10 Por tema Carlos Ortega
Hola,
Si lo estoy entendiendo bien, lo que tienes que crearte es una función.
A la función le pasarías unos parámetros (las columnas y el dataframe al
que añadir la transformación), y en el cuerpo de la función haces esos
cálculos.

Gracias,
Carlos.



Gracias,
Carlos.

El jue., 10 sept. 2020 a las 3:55, Samura . ()
escribió:

> Hola,
> me gustaría hacer algo como en el siguiente ejemplo
>
> A un df añadirle una columna que es la transformación de otra,
> en plan a todo lo que sea  x1, x2, x3 lo llamo prueba 1
> todo lo que sea x4,x5,x6 lo llamo prueba 2
> el resto de x las dejo como están.
>
> Sería algo así
>
> col1 <- c('x1', 'x2', 'x11', 'x1','x33', 'x1','x4', 'x5', 'x35',
> 'x1','x2', 'x4')
> df1<-data.frame(col1)
> attach(df1)
>
> df1$transformacion<-ifelse(col1 == "x1"|col1 == "x2"| col1 == "x3",
> "prueba1",
>ifelse(col1 == "x4"|col1 == "x5"| col1 == "x6",
> "prueba2", col1))
>
> detach(df1)
> df1
>
> pero ahora en vez de un df tengo varios
>
> col2 <- c('x12', 'x4', 'x6', 'x771','x4', 'x2')
> col3 <- c('x7', 'x2', 'x4', 'x5','x111', 'x1','x4', 'x5', 'x35','x2','x2',
> 'x4','x6', 'x5')
> df2<-data.frame(col2)
> df3<-data.frame(col3)
>
> ¿cómo puedo aplicar el código al resto de los df sin tener que repetirlo?
>
>
>
>     [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tabla con dibujo en R Markdown

2020-09-04 Por tema Carlos Ortega
Hola,

Sí, mira esta referencia:

https://stackoverflow.com/questions/50108763/how-to-insert-images-into-table-in-r-markdown

Saludos,
Carlos Ortega
www.qualityexcellence.es

El sáb., 5 sept. 2020 a las 1:37, Samura . ()
escribió:

>
> Hola a tod@s!!
>
> Se podría crear en R Markdown una tabla de este estilo?
>
>
>
>
> A las malas se puede poner la tabla entera como una imagen, pero me
> gustaría saber si R Markdown
> permite meter imágenes dentro de tablas.
>
> Gracias.
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Vulnerabilidad

2020-09-04 Por tema Carlos Ortega
Hola,

Sí, en varias grandes empresas cuando me ha tocado participar en la puesta
en marcha de un entorno con R/RStudio enseguida aparece la necesidad de
instalar paquetes.

Los responsables de IT aceptan la instalación de paquetes desde CRAN,
prohiben tajantemente los que solo están en fase de desarrollo en GitHub.
Pero es que incluso al os que vienen de CRAN buscan garantizar de alguna
manera que éstos están libres de posibles vulnerabilidades, puntos débiles
que puedan usar hackers para crear problemas en estos entornos de
desarrollo (por mucho que se les comenta todo el proceso de comprobaciones,
checks por los que un nuevo paquete pasa.

La siguiente vez que me toque recomendar el uso de un entorno de R en un
entorno empresarial, y vuelva a aparecer esta duda sobre las
vulnerabilidades de los paquetes de CRAN, el usar este paquete aplicado
sobre los nuevos que se quieran descargar será otro argumento (de peso)
para dar tranquilidad a los de IT/Seguridad.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El vie., 4 sept. 2020 a las 22:16, Javier Marcuzzi (<
javier.ruben.marcu...@gmail.com>) escribió:

> Estimado Carlos Ortega, veo que usted comenta algo sobre el siguiente
> artículo
> https://www.jumpingrivers.com/blog/r-package-vulnerabilities-security/ en
> su LinkedIn.
>
> ¿Podría compartir su impresión, comentario, sugerencia?
>
> Desde ya muchas gracias.
>
> Javier Rubén Marcuzzi
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Request

2020-09-01 Por tema Carlos Ortega
Hola,

Eres tú misma la que te tienes que dar de baja de la lista.
Tienes que haber recibido de forma periódica un correo de
r-project.org mailing list memberships reminder
En el que te indica detalles de tu suscripción. Usando ese correo te puedes
dar de baja y cancelar la suscripción.

Saludos,
Carlos.

El mar., 1 sept. 2020 a las 16:45, Fernanda Magaña ()
escribió:

> Quiero dar de baja mi suscripción, por favor.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Instalar paquete en nueva versión de R

2020-09-01 Por tema Carlos Ortega
Hola Raúl,

Sí, borras el paquete que has instalado y prueba a instalarlo como viene en
la página Web:

   - install.packages("CASdatasets", repos = "http://cas.uqam.ca/pub/R/;,
   type="source")

A mi de tu modo no me ha funcionado me aparece el mismo error.
Pero de esta otra forma, ha cargado sin problemas (también en Mac).

Gracias,
Carlos Ortega
www.qualityexcellence.es


El mar., 1 sept. 2020 a las 13:37, Raúl Vaquerizo (<
rvaquer...@analisisydecision.es>) escribió:

> Hola, me estoy crispando con un tema que no es la primera vez que he
> resuelto pero (extrañamente) ahora no puedo resolver. Estoy instalando
> un paquete que no está disponible en la versión 4 de R:
>
> packageurl <-
> "
> http://cas.uqam.ca/pub/R/bin/macosx/el-capitan/contrib/3.6/CASdatasets_1.0-10.tgz
> "
> install.packages(packageurl, repos = NULL, dependencies = TRUE,
> type="source")
>
> Se instala correctamente pero:
>
> library(CASdatasets)
> Error: package or namespace load failed for ‘CASdatasets’:
>   package ‘CASdatasets’ was installed before R 4.0.0: please re-install
> it
>
> En windows no he tenido ningún problema, ahora estoy trabajando con MAC:
>
> > R.Version()
> $platform
> [1] "x86_64-apple-darwin17.0"
>
> $version.string
> [1] "R version 4.0.0 (2020-04-24)"
>
>
> Descargando el *tgz p puedo acceder a la carpeta data que es la que me
> interesa, pero ¿qué me está fallando? Gracias.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cálculo - intervalo de confianza - modelo nls - predict

2020-09-01 Por tema Carlos Ortega
Hola,

A través del paquete "broom" vas a poder obtenerlos de una forma muy
compacta y manejable.
Mira cómo hacerlo en esta función de "broom":

   - tidy.nls {broom}

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 1 sept. 2020 a las 12:57, María Ángeles Onieva (<
m.onieva.medi...@gmail.com>) escribió:

> Buenas tardes,
>
> Quisiera obtener el intervalo de confianza (y también intervalos de
> predicción) para los valores predichos en un modelo nls.
> ¿Hay alguna manera que no sea por ggplot2 (me interesaría obtener el valor
> listado -además de en el gráfico-) o por bootstrap?
>
> Os copio el código del ajuste del modelo y predicción para los 3 días
> siguientes:
>
> *#Ajuste del modelo*
>
> model = nls(formula = N~K*exp(-log(K/N0)*exp(-a*(t-t0))),
> data = datos,
> start = list(K=300, a = 0.25))
>
> *#Predicción para 3 días*
>
>  new_juliano =
>
> c(juliano,juliano[(length(juliano))]+1,juliano[(length(juliano))]+2,juliano[(length(juliano))]+3)
>   casos_predichos = predict(model,data.frame(t = new_juliano),interval =
> "conficende",level = 0.95)
>
> Teóricamente debería devolver los intervalos con esto último, sin embargo,
> no los obtengo.
>
> Muchas gracias de antemano.
> Un cordial saludo,
>
> --
>
> María Ángeles
>
> [[alternative HTML version deleted]]
>
> ___________
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] (sin asunto)

2020-08-24 Por tema Carlos Ortega
Hola Manuel,

Resolver el punto de corte de forma analítica implicaría el tener ajustada
cada densidad también de forma analítica.
Una alternativa que se me ocurre es la siguiente:

   - Con la función "density()" ajustar la densidad de las presencias y las
   ausencias.
  - Con esta función (del paquete base) obtienes los valores x e y.
  Seguro que dentro del objeto de ggplot también está, pero con "density()"
  acceder a esos valores es mucho más sencillo.
   - Esos valores x, y de cada densidad, los puedes ajustar con una función
   polinómica, o vaya si conoces el tipo de función analítica a la que se
   debieran de ajustar, puedes ajustar los valores a esos datos (función
   "nls()" ).
  - Y teniendo ya las funciones analíticas el problema se reduce a
  solucionar el sistema de ecuaciones para encontrar los puntos de corte
  (función "solve()").

Vaya, es un tanto elaborado, pero con un par de funciones sencillas, se
puede automatizar todo esto. :-).

Gracias,
Carlos Ortega
www.qualityexcellence.es

El lun., 24 ago. 2020 a las 14:17, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenas tardes, tengo una variable bimodal (*var)*, de presencias y
> ausencias (1s y 0s) y otra variable, *prob*, con las probabilidades que
> le asigna un modelo (entre 0 y 1).
> Con: *ggplot(Preds, aes(x=prob, fill= var )) + geom_density(alpha=.3)*
> obtengo la distribución de las presencias y de las ausencias, por
> separado, en función del valor de probabilidad asignado. Las dos curvas se
> cruzan en un punto. ¿Sabéis si hay forma de averiguar el valor de *prob* de
> ese punto analíticamente?
> Gracias,
> Manuel
> [image: image.png]
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Redo en RStudio, Ctrl y?

2020-08-19 Por tema Carlos Ortega
Hola Manuel,

En Mac son otra combinación, pero sí que funcionan.
RStudio tiene un grupo de soporte (más bien es una Community) donde podrías
comentarlo por si es un bug.

Saludos,
Carlos Ortega
www.qualityexcellence.es


El mié., 19 ago. 2020 a las 19:52, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenas tardes. Más bien una curiosidad.
> Echaba de menos poder rehacer con *Ctrl y* lo deshecho con *Ctrl z*. Lo
> curioso es que RStudio, desde hace un tiempo, en la pestaña *Edit*, al lado
> de *Redo *pone "*Ctrl y", *pero *Ctrl y* no funciona. ¿sabe alguien por
> qué?
> Gracias,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] error al cargar librería Tidyverse

2020-08-08 Por tema Carlos Ortega
Hola,

Sí, el propio mensaje de error te lo está diciendo...

*error: there is no package called ‘backports’*

Prueba a instalar este paquete primero (backports) y luego ya instala
"tidyverse".

Saludos,
Carlos Ortega
www.qualityexcellence.es

El sáb., 8 ago. 2020 a las 16:46, Lissette Fuentes Lorca (<
lissette...@gmail.com>) escribió:

> Hola! estoy intentando cargar la librería Tydiverse y me da el siguiente
> error:
> Error: package or namespace load failed for ‘tidyverse’:
>  .onLoad failed in loadNamespace() for 'broom', details:
>   call: loadNamespace(name)
>   error: there is no package called ‘backports’
>
> En la instalación del paquete no tuve inconvenientes.
> Alguna idea de por dónde viene este error?
>
> Muchas gracias!
> Lissette
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráfico barras 3 ejes

2020-08-04 Por tema Carlos Ortega
Hola,

Sí, esto lo puedes hacer con la librería "lattice", "ggplot" no lo permite.
 Mira la página 53 de este documento. En "lattice" se hace con la función
"cloud()".

Saludos,
Carlos Ortega.
www.qualityexcellence.es

El mar., 4 ago. 2020 a las 19:10, Andrés Hirigoyen (<
andreshirigo...@gmail.com>) escribió:

> Buenas tardes, quisiera hacer un gráfico como el de la figura ¿alguna
> sugerencia? con ggplot2 no he podido.
> Muchas gracias  [image: Captura.JPG]
>
> --
> *Andrés Hirigoyen*
> * Prof. Ciencias Biológicas*
> *Ing. Agr. Forestal (MSc) *
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] State-of-the-art NLP models from R

2020-08-03 Por tema Carlos Ortega
Hola Diego,

Prueba a hacer otra cosa.

   - Abre una consola y activa ese environment que has creado (r-reticulate)
   - Y una vez activado escribe "python". Entrarás a  la consola de
   "python".
   - Ahí, escribe "import transformers"
   - Si no te devuelve error, es que en el entorno está bien instalado esa
   librería y por tanto el problema es de acceso desde "R".

Gracias,
Carlos Ortega
www.qualityexcellence.es

El lun., 3 ago. 2020 a las 13:53, Diego Martín ()
escribió:

> Estimados compañeros:
>
>   Muchísimas gracias a todos por
> responderme. Especialmente a Carlos Ortega que, como siempre, me ha vuelto
> a enseñar el camino.
>
>   El asunto era exactamente como decía
> Carlos; habiendo yo aplicado la siguiente solución:
>
> library(reticulate)
>
> conda_create(envname = "r-reticulate",
>  packages = "python",
>  forge = TRUE,
>  channel = character(),
>  conda = "auto")   # Create a new environment. No
> muestro el resultado porque ha sido muy largo.
># Pero puedo resumirlo con la
> siguiente función.
> > conda_list()
>
>   name
> 1anaconda3
> 2 r-reticulate
> 3 r-tensorflow
>python
> 1   /anaconda3/bin/python
> 2 /anaconda3/envs/r-reticulate/bin/python
> 3 /anaconda3/envs/r-tensorflow/bin/python
>
> py_install(
>   packages = c("transformers"),
>   envname = "r-reticulate",
>   method = c("conda"),
>   conda = "auto",
>   python_version = NULL,
>   pip = TRUE
>   )# Tampoco saco el resultado porque es
> igualmente largo, solo dejo la prueba
># de que fue bien.
>
> Solving environment: ...working... done
>
> Por tanto, parecería que todo está resuelto,
> sobre todo tras cargar las librerías de keras, tensorflow, dplyr y
> tfdatasets, como indica el post citado. Sin embargo, algo no debo estar
> haciendo bien, porque el siguiente paso imprescindible para seguir
> entendiendo el post, el que muestro ahora, da un error.
>
> > transformer <- reticulate::import(module = "transformers",
> +as = NULL,
> +convert = TRUE,
> +delay_load = FALSE)
> Error in py_module_import(module, convert = convert) :
>   ModuleNotFoundError: No module named 'transformers'
>
>   Había yo creído que, habiendo ido bien
> py_install, con el *package* transformers, no podría decirme ahora
> import, que no hay un módulo llamado 'transformers'. De hecho vi como tras
> acabar py_install, decía:
>
> Successfully built regex sacremoses
>
> Installing collected packages: urllib3, idna, chardet, requests,
> pyparsing, six, packaging, regex, click, joblib, tqdm, sacremoses,
> sentencepiece, numpy, tokenizers, filelock, *transformers*
>
> Successfully installed chardet-3.0.4 click-7.1.2 filelock-3.0.12 idna-2.10
> joblib-0.16.0 numpy-1.19.1 packaging-20.4 pyparsing-2.4.7 regex-2020.7.14
> requests-2.24.0 sacremoses-0.0.43 sentencepiece-0.1.91 six-1.15.0
> tokenizers-0.8.1rc1 tqdm-4.48.1 *transformers-3.0.2* urllib3-1.25.10
>
>  Con lo cual, me pareció haber logrado el paso de
> instalación pero, está claro que no es así, porque no daría sino, el error
> en import de *ModuleNotFoundError*.
>
>   Me resulta embarazoso, pero es que no lo veo. No
> sé si alguno de ustedes ve lo que no hago bien.
>
>   Muchas gracias una vez más. Atentamente.
>
>   Diego Martín Oliva.
>
>
>
>
>
>
>
>
> El dom., 2 ago. 2020 a las 23:00, Javier Marcuzzi (<
> javier.ruben.marcu...@gmail.com>) escribió:
>
>> Estimados
>>
>> Una pregunta, ¿Que posibilidad hay que esté instalado todo correctamente,
>> pero algo cambie en entorno de python, el cual al ser buscado por R esté
>> dando problemas?
>>
>> Hace años que no utilizo macOS, pero se me ocurre que un programa coloque
>> en entorno adecuado para él, pero al mismo tiempo este toque al entorno
>> requerido por R.
>>
>> Javier Rubén Marcuzzi
>>
>> El dom., 2 ago. 2020 a las 15:59, Carlos Ortega (<
>> c...@qualityexcellence.es>) escribió:
>>
>>> Hola Diego,
>>>
>>> El error que obtienes no es de usar una versión específica de Python, si
>>> no
>>

Re: [R-es] State-of-the-art NLP models from R

2020-08-02 Por tema Carlos Ortega
Hola Diego,

El error que obtienes no es de usar una versión específica de Python, si no
de encontrar un "environment" específico donde hacer la instalación con
"pip".
Mira aquí en la ayuda:

https://rstudio.github.io/reticulate/articles/python_packages.html

En la sección de "Conda" donde aparece cómo crear un entorno e indicárselo
a R para que instale ahí tus nuevas librerías.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom., 2 ago. 2020 a las 19:27, Diego Martín ()
escribió:

> Estimados compañeros:
>
>  Estoy interesado en el NLP, así que,
> al hallar el post State-of-the-art NLP models from R
> <
> https://blogs.rstudio.com/ai/posts/2020-07-30-state-of-the-art-nlp-models-from-r/
> >,
> gracias a Carlos Ortega, me puse con ilusión a leerlo. Sin embargo, tengo
> problemas con lo más básico, la instalación del paquete *transformers*. No
> puedo continuar sin ello.
>
>  El hecho es que me pasa lo siguiente:
>
> > library(reticulate)
> > use_python("/usr/local/bin/python3.7")
> > Sys.which(c("python3.7"))
>  python3.7
> "/usr/local/bin/python3.7"
> > py_install(packages = c("transformers"),
> +python_version = 'python3.7',
> +pip = TRUE)
> Error: could not find a Python environment for /usr/bin/python
>
>   Vamos, que no puede encontrar donde está
> Python en mi máquina. Pero yo creía haberlo dicho con:
> *use_python("/usr/local/bin/python3.7")*, lo cual había comprobado
> accediendo a consultar en el directorio de mi máquina oportunamente. Lo
> muestro a continuación.
>
> MacBook-Pro-de-Diego:bin Diego$ pwd
>
> /usr/local/bin
>
> MacBook-Pro-de-Diego:bin Diego$ ls python*
>
> python python2.7-config python3.7m
>
> python-config python3 python3.7m-config
>
> python2 python3-config pythonw
>
> python2-config python3.7 pythonw2
>
> python2.7 python3.7-config pythonw2.7
>
> MacBook-Pro-de-Diego:bin Diego$
>
> Si pusiera python, sin especificar 3.7,
> tampoco conseguiría más. Mirad.
>
> > use_python("/usr/local/bin/python")
> > Sys.which(c("python"))
>python
> "/usr/bin/python"
> > py_install(packages = c("transformers"),
> +python_version = 'python',
> +pip = TRUE)
> Error: could not find a Python environment for /usr/bin/python
>
> He mirado qué podría estar pasando y
> como me dicen en  R Interface to Python
> <https://rstudio.github.io/reticulate/>, tengo que especificar el camino;
> pero eso he hecho, o al menos eso creo.
>
> Python en mi máquina está bien, porque
> tengo Anaconda-Navigator y uso Spyder, y funciona muy bien. Es más
> recientemente he estado haciendo un curso usando este IDE, y no tuve el más
> mínimo problema.
>
> Por favor, ¿alguno de ustedes sabe qué
> podría estar pasándome?, ¿qué confundo o qué me falta?.
>
>         Muchísimas gracias por adelantado por
> la ayuda y paciencia que me presten.
>
>  Diego Martín Oliva.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problemas con formato fecha al importar base .sav (spss)

2020-07-31 Por tema Carlos Ortega
Hola,

Si puedes pasar un ejemplo de cómo queda el vector porque a lo mejor hay
que reconstruir ese vector a fecha/hora antes de convertirlo a tipo Date.

Gracias,
Carlos.

El vie., 31 jul. 2020 a las 7:04, juan manuel dias ()
escribió:

> Hola,
> Estoy con un problema para poder traer fecha de spss a r.
> El formato de la fecha en spss está (dia/mes/año/hora:minuto:segundo) y lo
> querría ver igual en el data frame en r.
>
> Hago lo siguiente.
>
> # llamo el archivo .sav
> migra_mayo_2020<-read.spss("Mayo 2020.sav", to.data.frame = TRUE)
>
> #transformo
> migra_mayo_2020 <- transform(migra_mayo_2020,FECHA_CR=as.Date(ISOdate(1582,
> 10, 14) + migra_mayo_2020$FECHA_CR))
>
> El campo fecha al importarlo de .sav al data frame en R me genera un vector
> numèrico de 11 dígitos. Lo intente con as.POSIXct y tampoco tuve
> resultados,  pierdo las horas minutos y segundos.
>
> Muchas gracias!
>
>
>
>
>
>
> <
> http://www.avg.com/email-signature?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> Libre
> de virus. www.avg.com
> <
> http://www.avg.com/email-signature?utm_medium=email_source=link_campaign=sig-email_content=webmail
> >
> <#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Análisis de datos extremadamente atípicos

2020-07-19 Por tema Carlos Ortega
Hola Ricardo,

En estos casos, vas a poder visualizar mejor las distribuciones si usas
gráficos del tipo "violinplots".
Son especialmente útiles para poder visualizar cambios en distribuciones en
el tiempo.

Otra alternativa con la que puedes ver estas diferencias es con los
gráficos del paquete "ggridges".

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom., 19 jul. 2020 a las 11:43, ricardo alva ()
escribió:

> Hola amigos buenas noches.
> Estoy intentando comparar la distribución de una misma variable continúa
> pero en dos lapsos de tiempo diferentes. Lo malo es que los datos son
> demasiados atípicos y a través de box plots no se puede apreciar por la
> gran cantidad de atípicos que hay, lo que hace que las cajas no se aprecien
> y sólo se visualice puros atípicos amontonados. Como podría determinar si
> de manera global los datos han aumentado o disminuido de valor,
> considerando que las mediciones corresponden a individuos diferentes. Que
> gráficos me pueden servir para esto?
>
> Enviado desde mi Movistar HUAWEI P smart 2019
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Consulta: Manejo de bases de datos y ejemplos de procesamiento estadístico.

2020-07-12 Por tema Carlos Ortega
Hola,

Puedes empezar aprendiendo con estos documentos que sirven de introducción
gratuitos que los puedes encontrar en esta página (busca por "Spanish"):

https://cloud.r-project.org/other-docs.html

Gracias,
Carlos Ortega
www.qualityexcellence.es



El dom., 12 jul. 2020 a las 18:51, Gerardo Pedraza Vega (<
gpedra...@ut.edu.co>) escribió:

> Buen día para todos, reciban un cordial saludo;
>
> Quiero preguntarles si me pueden brindar algunos ejemplos practicos para
> iniciar mi estudio estadístico con R. Procesamiento de datos, bases de
> datos y ejemplos.
>
> Agradezco la atención prestada. Saludos.
>
> --
>
> 
> *Atte:*
> *Gerardo Pedraza Vega*
> *Especialista en Estadística*
> *Economista*
> *Joven investigador, **Grupo Cadenas de Valor & Competitividad Regional*
> *Facultad de Ciencias Económicas y Administrativas*
> *Universidad del Tolima*
> *Cel: 316-437-3329*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] agrupar observaciones de una columna

2020-07-12 Por tema Carlos Ortega
Hola,

Mira la función "aggregate()".
Hay otras muchas formas de crear esa nueva variable que es la suma de casos
por Municipio y agrupado por Sexo, pero puedes empezar por esta.

Gracias,
Carlos.

El dom., 12 jul. 2020 a las 17:00, depaso () escribió:

> Hola!
>
> Estoy empezando con R y tengo que analizar una base de datos sobre COVID.
>
> Una de las columnas recoge si los casos son de hombres o de mujeres y no
> sé cómo transformarlo en una columna que solo sume los casos totales,
> independientemente de si son hombres o mujeres (pero sí me interesa
> diferenciarlos por día y municipio, como ya aparecen).
>
> Adjunto pantallazo para hacer más comprensible mi duda, que afecta a la
> columna *SexeDescripcio*.
>
> Muchas gracias y un saludo!
>
> --
> ànnia
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] problemas con el comando "twoway.plots"

2020-07-10 Por tema Carlos Ortega
Hola,

No sé si usas el paquete PASWR2 o PASWR para usar esa función.
Ninguno de los dos paquetes se han actualizado recientemente (uno es del
2012 y otro del 2016).
Y me cuesta creer que R-4.0 haya introducido un cambio tan grande como para
que no funcionen estas funciones.

Al menos los ejemplos de los dos paquetes, de esa función, no generan
ningún error.

¿Has comprobado que en tus datos tienes todo en orden.
Por el error, tiene pinta de que alguno de los valores no fuese un valor
numérico o hubiera un missing.

Gracias,
Carlos Ortega
www.qualityexcellence.es



El vie., 10 jul. 2020 a las 12:25, Juan Bautista ()
escribió:

> Hola a todos.
>
> Estoy intentando con la última versión de “R” usar el comando
> “twoway.plots ()”
>
> No me funciona y siempre me aparece el siguiente error:
>
>
>
> > twoway.plots (SINTOMAS, PRODUCTO, DOSIS, COL = c("#A9E2FF", "#0080FF"))
>
> Error in plot.window(...) : se necesitan valores finitos de 'xlim'
>
> Además: Warning messages:
>
> 1: In xy.coords(x, y, xlabel, ylabel, log) : NAs introducidos por coerción
>
> 2: In min(x) : ningún argumento finito para min; retornando Inf
>
> 3: In max(x) : ningun argumento finito para max; retornando -Inf
>
>
>
> Esta misma orden en el mismo editor cuando la usaba en otras versiones
> anteriores de “R” siempre ha funcionado.
>
> Alguien me puede ayudar a interpretar el mensaje de error o si en la nueva
> versión de “R” tengo que instalar algún paquete que antes no hacia falta??
>
> Gracias. Un saludo.
>
> *Juan Bautista Relloso Barrio*
> Coordinador de equipos e infraestructuras \ Técnico del departamento de
> producción vegetal
> *jbauti...@neiker.eus **  - 688 62 98 14*
>
> *www.neiker.eus* <http://www.neiker.eus/> *[image:
> cid:image001.png@01D639B0.4AF49AA0]*
> <https://www.linkedin.com/company/neiker/> *[image:
> cid:image002.png@01D639B0.4AF49AA0]* <https://twitter.com/neiker_BRTA>*[image:
> cid:image003.png@01D639B0.4AF49AA0]* <https://www.facebook.com/neikerBRTA>
>  *[image: cid:image004.png@01D639B0.4AF49AA0]*
> <https://www.youtube.com/user/neikertec>
>
> *[image: cid:image005.png@01D639B0.4AF49AA0]*
>
> PRIBATUTASUN POLITIKA <https://neiker.eus/eu/pribatutasun-politika/> | 
> POLÍTICA
> DE PRIVACIDAD <https://neiker.eus/es/politica-privacidad/> | LEGAL NOTICE
> <https://neiker.eus/en/privacy-policy/>
>
> [image: cid:19E3FEBFC8DA614E8D1A7A6FD4C1836C@elkarlan.euskadi.eus]
>
> [image: cid:image014.png@01D392B1.A4AF1280]
>
> Este correo electrónico contiene información privada que puede estar
> legalmente protegida, parcial o totalmente. Es sólo para uso del
> destinatario al que está dirigido. Si ha recibido este mensaje por error,
> le rogamos que lo notifique al remitente del email y que además borre de su
> sistema el mensaje así como todas sus copias, incluyendo las posibles
> copias del mismo en su disco duro, y se abstenga de usar, revelar,
> distribuir a terceros, imprimir o copiar ninguna de las partes de este
> mensaje.
>
>
>
> Mezu elektroniko honek informazio pribatua du, partzialki edo osorik legez
> babestuta egon daitekeena. Bidali nahi zaion hartzaileak erabiltzeko
> bakarrik da. Mezu hau hutsegite baten ondorioz jaso baduzu, mesedez,
> mezuaren igorleari jakinaraztea eta mezua eta horren kopia guztiak
> ezabatzea eskatzen dizugu, disko gogorrean izan ditzakezunak barne. Eta,
> orobat, ez erabili mezu honen zatirik, ez eta erakutsi, beste pertsona
> batzuei banatu, inprimatu edo berridatzi ere.
>
> This e-mail contains private information that can be legally protected,
> partially or completely. It is intended only for use by the recipient to
> whom it is addressed. If you receive this e-mail in error, please notify
> the sender and then delete it from your system, including any copies in
> your hard disk, without forwarding, printing or copying any part of the
> e-mail.
>
> *Centro de Arkaute-ko Zentroa*
> Campus Agroalimentario de Arkaute - E-01080 Vitoria-Gasteiz (Araba) Tel:
> (+34) 945 121 313 / Fax: (+34) 945 281 422
>
> *Centro de Derio-ko Zentroa*
> Bizkaiko Parke Teknologikoa, 812.L. - E-48160-Derio (Bizkaia) Tel: (+34)
> 944 034 300 / Fax: (+34) 944 034 310
>
> [image: facebook]
> <http://www.facebook.com/pages/NEIKER-Tecnalia/131992493534220>[image:
> twitter] <http://twitter.com/#%21/neikertecnalia>[image: linkedin]
> <http://www.youtube.com/user/neikertec>[image: youtube]
> <http://es.linkedin.com/in/neikertecnalia>
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Sumar valores dentro de una clase

2020-07-04 Por tema Carlos Ortega
Hola,

¿Son tres columnas?...
Solo tienen nombre dos...¿?

   hID
 1: 18,2 20556
 2: 18,5 20556
 3: 20,9 20556
 4: 19,2 20665

Y lo que quieres al final ¿es sumar el valor de ID de cada clase?

Gracias,
Carlos Ortega.


El sáb., 4 jul. 2020 a las 22:30, Andrés Hirigoyen (<
andreshirigo...@gmail.com>) escribió:

> Va ejemplo:
>
> data <- Ejemplo_List
> cl<-round(seq(0,max(data$h),10),2) # seq para clases
> df<-data.frame(min.h=cl[-length(cl)],max.h=cl[-1])  # Data frame con las
> clases
> df$class<-paste(df$min.h,df$max.h,sep="-") # Armo las Clases
> df$Largo <-NA # Variable nueva
>   #  Completo la columna "Largo" con la cantidad de observaciones que
> están entre el mínimo y el máximo de cada clase ( [i])
> for (i in 1:nrow(df)) df$Largo[i]<-nrow(subset(data, h>df$min.h[i] &
> h<=df$max.h[i]))
> ## Objetivo es crear la variable Total que es la suma de ID de cada
> observación perteneciente a cada clase
>   df$Total <-NA
> Muchas gracias
>
> El sáb., 4 de jul. de 2020 a la(s) 16:59, Carlos Ortega (
> c...@qualityexcellence.es) escribió:
>
>> Hola,
>>
>> Si pudieras compartir un subconjunto de datos con el que se pudiera
>> entender mejor tu código...
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> El sáb., 4 jul. 2020 a las 18:00, Andrés Hirigoyen (<
>> andreshirigo...@gmail.com>) escribió:
>>
>>> Buenas mi duda es cómo sumar los valores de una variable dentro de una
>>> clase ya creada.
>>> Por ejemplo:
>>>
>>> #Creo el dataset que voy a completar, primero la secuencia con la q hare
>>> las clases:
>>> cl<-round(seq(0,max(data$h),0.5),2)
>>> #  Mi data frame con las clases
>>> df<-data.frame(min.h=cl[-length(cl)],max.h=cl[-1])
>>> #  Creo la columna "Largo" con la cantidad de observaciones que están
>>> entre
>>> el mínimo y el máximo de cada clase ( [i])
>>> for (i in 1:nrow(df)) df$Largo[i]<-nrow(subset(data, h>df$min.h[i] &
>>> h<=df$max.h[i]))
>>> Ahora, mi duda es cómo sumar el valor de esas observaciones para crear
>>> una
>>> nueva variable por clase.
>>> Espero se entienda, desde ya muchas gracias
>>>
>>> --
>>> *Andrés Hirigoyen*
>>> * Prof. Ciencias Biológicas*
>>> *Ing. Agr. Forestal (MSc) *
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> *Andrés Hirigoyen*
> * Prof. Ciencias Biológicas*
> *Ing. Agr. Forestal (MSc) *
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Sumar valores dentro de una clase

2020-07-04 Por tema Carlos Ortega
Hola,

Si pudieras compartir un subconjunto de datos con el que se pudiera
entender mejor tu código...

Gracias,
Carlos Ortega
www.qualityexcellence.es


El sáb., 4 jul. 2020 a las 18:00, Andrés Hirigoyen (<
andreshirigo...@gmail.com>) escribió:

> Buenas mi duda es cómo sumar los valores de una variable dentro de una
> clase ya creada.
> Por ejemplo:
>
> #Creo el dataset que voy a completar, primero la secuencia con la q hare
> las clases:
> cl<-round(seq(0,max(data$h),0.5),2)
> #  Mi data frame con las clases
> df<-data.frame(min.h=cl[-length(cl)],max.h=cl[-1])
> #  Creo la columna "Largo" con la cantidad de observaciones que están entre
> el mínimo y el máximo de cada clase ( [i])
> for (i in 1:nrow(df)) df$Largo[i]<-nrow(subset(data, h>df$min.h[i] &
> h<=df$max.h[i]))
> Ahora, mi duda es cómo sumar el valor de esas observaciones para crear una
> nueva variable por clase.
> Espero se entienda, desde ya muchas gracias
>
> --
> *Andrés Hirigoyen*
> * Prof. Ciencias Biológicas*
> *Ing. Agr. Forestal (MSc) *
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Quedarse con las muestras de una BD que están presentes otra, basado en dos variables

2020-06-27 Por tema Carlos Ortega
Hola Manuel,

Es un problema que puedes solucionar perfectamente con la función "merge()"
para juntar dos data.frames.
En esa función no tienes porqué usar solamente una clave común que sirva
para unir los dos data.frames, puedes usar varias claves.

Esta sería la sintaxis:

df_unido <- merge(df_uno, df_dos, by.x = c('clave_1_de_df_uno',
'clave_2_de_df_uno') , by.y = c('clave_1_de_df_dos', 'clave_2_de_df_dos'),
all = TRUE)

Y el "all = TRUE" del final, sirve para que solo te salgan los comunes en
los dos grupos.

Gracias,
Carlos Ortega
www.qualityexcellence.es



El vie., 26 jun. 2020 a las 21:39, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenas tardes, quedarme con las muestras de una BD (data) que están
> presentes en otra (datax), cuando se tiene una variable que nunca se repite
> (Key) es fácil: data <- subset(data,data$Key %in% datax$Key).
> Mi problema es cuando la exclusividad viene dada por dos variables. P.e.,
> las coordenadas de un mapa: lon y lat.
> ¿Como puedo quedarme con las muestras de una df cuya lon y lat son iguales
> a la de otra?
> Gracias, como siempre,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problema con un loop for

2020-06-24 Por tema Carlos Ortega
Hola Manuel,

¿No tienes un pequeño ejemplo reproducible?...
RFfit es del paquete RandomFields, no?... Y partial?.

Por construir un pequeño ejemplo y ver qué se puede hacer.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mié., 24 jun. 2020 a las 19:03, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Vuelvo al ataque, pues ya os lo pregunté.  Javier Rubén me dió una posible
> explicación, pero finalmente no me resolvió el problema. Así que lo vuelvo
> a intentar, a ver si hay más suerte.
>
> Si hago, p.e., i = 1 y corro las 2 filas de dentro del loop que pongo
> abajo, me abre una ventana y me hace el
> partial() de frg, es decir, lo hace bien, pero si corro todo el loop, me
> abre las 9 ventanas (de 9 predictores) pero las deja vacías.
>
> predictores <- c("frg","omn","bc","co","pr","gg","fg","mf","br","hc")
>
> for(i in 1:length(predictores)){
> windows()
> partial(RFfit, pred.var = predictores[i], which.class = "Ard", plot =
> T,
> prob = T, chull=T, type="classification",plot.engine = "ggplot2",
> rug=T)
>   }
>
> Esto está, a su vez, dentro de otro loop con varias categorías, por lo que
> al final son 36 gráficos, que debo hacer con distintos parámetros, por lo
> que me sería muy útil solucionar el problema, que debe ser una chorrada.
>
> Gracias por vuestra ayuda,
> Manuel
>
>     [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] excel

2020-06-11 Por tema Carlos Ortega
Hola José,

Tienes que incluir esa ruta donde quieres dejar el fichero en la línea de
"saveWorkbook("...
Así:

#--
library(openxlsx)
wb <- createWorkbook(creator = Sys.getenv("USERNAME"))
addWorksheet(wb, "Data")
pt$writeToExcelWorksheet(wb=wb, wsName="Data",
 topRowNumber=1, leftMostColumnNumber=1,
 applyStyles=TRUE, mapStylesFromCSS=TRUE)
saveWorkbook(wb, file="C:\\*Escritorio\\*test.xlsx", overwrite = TRUE) #
salvarla en
otro lugar
#---

Mira en tu explorador de archivos de windows para ver cómo se llama
realmente la carpeta, porque aunque tengas un Windows en español, en vez de
"Escritorio" ese directorio, se llama "Desktop".

Gracias,
Carlos.
www.qualityexcellence.es


El jue., 11 jun. 2020 a las 14:39, Jose Betancourt B. ()
escribió:

> Estimados
> NO ENCUENTRO EL FORMATO ADECUADO PARA SALVAR LA TABLA EXCEL EN OTRO
> LUGAR, por ejemplo, en escritorio
>
> library(pivottabler)
> pt <- PivotTable$new()
> pt$addData(bhmtrains)
> pt$addColumnDataGroups("TrainCategory")
> pt$addColumnDataGroups("PowerType")
> pt$addRowDataGroups("TOC")
> pt$defineCalculation(calculationName="TotalTrains",
> summariseExpression="n()")
> pt$evaluatePivot()
>
> library(openxlsx)
> wb <- createWorkbook(creator = Sys.getenv("USERNAME"))
> addWorksheet(wb, "Data")
> pt$writeToExcelWorksheet(wb=wb, wsName="Data",
>  topRowNumber=1, leftMostColumnNumber=1,
>  applyStyles=TRUE, mapStylesFromCSS=TRUE)
> saveWorkbook(wb, file="C:\\test.xlsx", overwrite = TRUE) # salvarla en
> otro lugar
> --
>
>
>
> saludos
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] líneas sobre un mapa

2020-06-06 Por tema Carlos Ortega
Hola,
¿Por qué no incluyes directamente la línea vertical en cada iteración?.

world<-map_data('world')
pyt<-  ggplot(data, aes(x = longitud, y = latitud, color =
ptyrup,size=ptyrup)) +
  geom_point()+
 *geom_vline(xintercept = i)*
  scale_color_manual(values = c('lightslateblue','black')) +
  scale_size_manual(values=c(1,2))+
  theme(legend.position="top")
windows();pyt

Si luego vuelves a llamar a "pyt" efectivamente vuelve a reproducir todo el
mapa.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El sáb., 6 jun. 2020 a las 20:41, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Gracias Emilio, no sé cómo ponerte un ejemplo reproducible. El mapa es un
> ggplot como el que te pongo abajo, y el análisis que se hace en cada vuelta
> del loop (que tienes abajo, del anterior email) es un árbol de
> clasificación que se entrena con una parte del mapa, dada por la longitud
> (lon), y se testa con la otra. Los resultados se almacenan en Preds. Como
> puedes ver, la i del loop/for determina lon, una de las variables de la
> base de datos del mapa, y a cada iteración del loop (valor de lon) me
> indica por qué valor va (print(i)). En vez de eso, o además de, me gustaría
> que me representase un linea sobre el mapa que se hizo previamente con
> ggplot, que se corresponda con el valor de lon.
> Este es el mapa (sigo abajo):
>
> world<-map_data('world')
> pyt<-  ggplot(data, aes(x = longitud, y = latitud, color =
> ptyrup,size=ptyrup)) +
>   geom_point()+
>   scale_color_manual(values = c('lightslateblue','black')) +
>   scale_size_manual(values=c(1,2))+
>   theme(legend.position="top")
> windows();pyt
>
> Si en el loop incluyo esto:
>   pyt<-pyt+geom_vline(xintercept = i)
>   print(pyt)
>
> a cada iteración me representa en el mapa la línea que yo quiero, pero lo
> hace representando el mapa de nuevo cada vez. La idea es que me añada la
> línea, cada vez, pero sin tener que representar el mapa, es decir, sobre el
> que ya estaba. Es por el efecto visual. Parece una tontería, pero frente a
> una audiencia esos detalles importan (hasta cierto punto).
>
> Gracias,
> Manuel
>
>
>
>
>
>
>
>
>
>
>
>
> El sáb., 6 jun. 2020 a las 12:01, Emilio L. Cano ( >)
> escribió:
>
> > Hola,
> >
> > Como ggplot son gráficos tipo “grid” seguramente puedas añadir las líneas
> > como un objeto “grob” sin tener que recargar el mapa.
> >
> > Con un ejemplo reproducible lo podría confirmar.
> >
> > Un saludo,
> >
> > Emilio L. Cano
> > http://emilio.lcano.com
> >
> >
> >
> > El 5 jun 2020, a las 17:48, Manuel Mendoza 
> > escribió:
> >
> > Gracias Emilio y Jorge. Tengo que explicarlo mejor. Mostrando a una
> > audiencia cómo hacer un tipo de análisis, se hace un loop (abajo) que
> > analiza un mapa por regiones longitudinales. Tal y como está el script,
> > print(i) te indica la longitud por la que va (de 10º en 10º) pero me
> > gustaría que en vez de eso te fuese representando una línea vertical
> sobre
> > el mapa, que he representado previamente con ggplot. No es
> imprescindible,
> > pero quedaría bien.
> >
> > Preds <- data.frame()
> >
> > for (i in seq(from = -180, to = 170, by = 10)){
> >   traindata <- subset(data, lon < i|lon>= i+10)
> >   testdata <- subset(data,(lon> i & lon<= i+10))
> >
> >   fitrp <- rpart(Clst ~ .- lon - lat, data=traindata,method = "class")
> >   print(i)
> >
> >   prd <- predict(fitrp, testdata, type="class") # se aplica el modelo a
> > las muestras test
> >   testdata$prd<-prd
> >   Preds<-rbind(Preds,testdata)
> > }
> >
> > El vie., 5 jun. 2020 a las 16:18, Emilio L. Cano (<
> emilopezc...@gmail.com>)
> > escribió:
> >
> >> Hola Manuel,
> >> Al ser ggplot supongo que será como en cualquier gráfico en ejes
> >> coordenados, añade una capa:
> >>
> >> ggplot(…..) + geom_vline(xintercept = vector_de_valores_x)
> >>
> >> Un saludo,
> >>
> >> Emilio L. Cano
> >> http://emilio.lcano.com
> >>
> >>
> >>
> >> > El 5 jun 2020, a las 13:48, Manuel Mendoza <
> mmend...@fulbrightmail.org>
> >> escribió:
> >> >
> >> > Buenos días ¿sabéis si hay alguna forma de añadir una recta vertical
> >> sobre
> >> > un mapa hecho previamente con ggplot? Lo que hago ahora es cargar
> >> > nuevamente el mapa con la línea añadida (una serie de líneas añadidas
> >> > secuencialmente en un loop

Re: [R-es] Cargar archivo .RData desde OneDrive, Google Drive o Dropbox

2020-05-30 Por tema Carlos Ortega
Ya, pero cuando cargas el fichero con "load()" *no* lo tienes que asignar a
ninguna variable.
Dentro del .RData lo que haces es guardar una variable/data.frame y al
cargarlo con "load()" esta variable/data.frame se incorpora a tu
environment.

Simplemente haz:

*load("restaurant.RData")*

No hagas la asignación "restaurant <- ".

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 31 may. 2020 a las 0:45, Rolando Valdez ()
escribió:

> Hola, gracias por la respuesta.
>
> Yo también puedo descargar el fichero pero no lo carga de forma correcta:
>
> > drive_download("
> https://drive.google.com/file/d/1iN7rT-W8WoXsdBpKzxcatFx7nGPWNkuz/view?usp=sharing
> ",
> +overwrite = TRUE, verbose = TRUE)
> File downloaded:
>   * restaurant.RData
> Saved locally as:
>   * restaurant.RData
> > restaurant <- load("restaurant.RData")
> > summary(restaurant)
>    Length Class  Mode
> 1 character character
>
> El sáb., 30 de may. de 2020 a la(s) 17:31, Carlos Ortega (
> c...@qualityexcellence.es) escribió:
>
>> Hola,
>>
>> He podido subir y bajar un fichero .RData a una cuenta de GooglDrive.
>> A la hora de subirlo,  he tenido primeramente que autorizar que desde R
>> pudiera interaccionar con esa cuenta de GoogleDrive, pero una vez
>> autorizado, subir y bajar el fichero no me ha dado mayor problemas.
>>
>> > drive_upload("ames.RData","ames.RData" )
>> Local file:
>>   * ames.RData
>> uploaded into Drive file:
>>   * ames.RData: 14g49n45AIRGuBlZg7hT_t7XhH0mJJG6d
>> with MIME type:
>>   * application/x-gzip
>> > drive_download("ames.RData", verbose = TRUE, overwrite = TRUE)
>> File downloaded:
>>   * ames.RData
>> Saved locally as:
>>   * ames.RData
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> El sáb., 30 may. 2020 a las 22:12, Rolando Valdez ()
>> escribió:
>>
>>> Hola a todos, espero que todo esté marchando bien.
>>>
>>> Estoy intentando cargar un archivo con extensión .RData desde OneDrive,
>>> Google Drive o Dropbox.
>>>
>>> Con OneDrive he intentado lo siguiente:
>>>
>>> temp <- tempfile()
>>> download.file("
>>>
>>> https://alumnosuatedu-my.sharepoint.com/:u:/g/personal/rivaldez_uat_edu_mx/ESNKsBZE5rhMp4_shdbavXEBz4mUuIaeKWIXlMMlpyqyUA?e=NfZupt
>>> ",
>>>   temp, method = "curl")
>>> restaurant <- load(temp)
>>>
>>> y obtengo lo siguiente:
>>>
>>> > restaurant <- load(temp)
>>> Error in load(temp) :
>>>   número mágico de archivo de restauración inválido (el archivo puede
>>> estar
>>> dañado) -- ningún dato recargado
>>> Además: Warning message:
>>> file ‘file2010767f7bdc’ has magic number '>>   Use of save versions prior to 2 is deprecated
>>>
>>> Creo que lo más cerca que he estado ha sido con google drive mediante la
>>> librería "googledrive"
>>>
>>> library(googledrive)
>>> drive_download("
>>>
>>> https://drive.google.com/file/d/1CJIP2kxOSQvQbUrasEvLfOm_Kyytk-Vz/view?usp=sharing
>>> ",
>>>        overwrite = TRUE)
>>> restaurant <- load("restaurant.RData")
>>>
>>> Pero me carga un objeto con 1 renglón y 1 columna.
>>> > summary(restaurant)
>>>Length Class  Mode
>>> 1 character character
>>>
>>> ¿Alguna sugerencia?
>>>
>>> Estoy indiferente si el archivo se carga en onedrive o google drive.
>>>
>>> Gracias de antemano.
>>>
>>> --
>>> Rol~
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Rol~
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cargar archivo .RData desde OneDrive, Google Drive o Dropbox

2020-05-30 Por tema Carlos Ortega
Hola,

He podido subir y bajar un fichero .RData a una cuenta de GooglDrive.
A la hora de subirlo,  he tenido primeramente que autorizar que desde R
pudiera interaccionar con esa cuenta de GoogleDrive, pero una vez
autorizado, subir y bajar el fichero no me ha dado mayor problemas.

> drive_upload("ames.RData","ames.RData" )
Local file:
  * ames.RData
uploaded into Drive file:
  * ames.RData: 14g49n45AIRGuBlZg7hT_t7XhH0mJJG6d
with MIME type:
  * application/x-gzip
> drive_download("ames.RData", verbose = TRUE, overwrite = TRUE)
File downloaded:
  * ames.RData
Saved locally as:
  * ames.RData

Saludos,
Carlos Ortega
www.qualityexcellence.es



El sáb., 30 may. 2020 a las 22:12, Rolando Valdez ()
escribió:

> Hola a todos, espero que todo esté marchando bien.
>
> Estoy intentando cargar un archivo con extensión .RData desde OneDrive,
> Google Drive o Dropbox.
>
> Con OneDrive he intentado lo siguiente:
>
> temp <- tempfile()
> download.file("
>
> https://alumnosuatedu-my.sharepoint.com/:u:/g/personal/rivaldez_uat_edu_mx/ESNKsBZE5rhMp4_shdbavXEBz4mUuIaeKWIXlMMlpyqyUA?e=NfZupt
> ",
>   temp, method = "curl")
> restaurant <- load(temp)
>
> y obtengo lo siguiente:
>
> > restaurant <- load(temp)
> Error in load(temp) :
>   número mágico de archivo de restauración inválido (el archivo puede estar
> dañado) -- ningún dato recargado
> Además: Warning message:
> file ‘file2010767f7bdc’ has magic number '   Use of save versions prior to 2 is deprecated
>
> Creo que lo más cerca que he estado ha sido con google drive mediante la
> librería "googledrive"
>
> library(googledrive)
> drive_download("
>
> https://drive.google.com/file/d/1CJIP2kxOSQvQbUrasEvLfOm_Kyytk-Vz/view?usp=sharing
> ",
>overwrite = TRUE)
> restaurant <- load("restaurant.RData")
>
> Pero me carga un objeto con 1 renglón y 1 columna.
> > summary(restaurant)
>Length Class  Mode
> 1 character character
>
> ¿Alguna sugerencia?
>
> Estoy indiferente si el archivo se carga en onedrive o google drive.
>
> Gracias de antemano.
>
> --
> Rol~
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] posición leyenda

2020-05-28 Por tema Carlos Ortega
Hola,

Prueba con la función "layout()" con la que puedes definir mejor las zonas
de representación de cada elemento. Mejor que con "par()".

Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue., 28 may. 2020 a las 17:54, Carmen Guzmán ()
escribió:

>   Hola tod@s, al utilizar 2 gráficos en uno con *par(mfrow=c(1,2)), *solo
> deseo poner leyenda por dentro a uno de los gráficos. Lo he hecho, pero
> deseo que la leyenda quede mas cerca del borde, ya que al máximizar la
> ventana extra x11(), la leyenda sale casi a la mitad del gráfico a pesar de
> usar topright con el código  legend('topright', legend =
> levels(Presas$Season), col = 1:4,
> cex = 0.7, pch = 16).
> Copio todo el código a continuación. Gracias
>
>
> x11()
> par(mfrow=c(1,2), mar=c(5,5,5,1) + .1)
>
> I.nought = -15.479969
> I1 = I.nought + 0
> I2 = I.nought + -0.319291
> I3 = I.nought + -5.606254
> B  = 0.051463
>
> plot(x   = Presas$Lat,
>  y   = Presas$C,
>  col = Presas$Season,
>  pch = 16,
>  xlab = "Latitude",
>  ylab = "C")
>
> abline(I1, B,
>lty=1, lwd=2, col = 1)
>
> abline(I2, B,
>lty=1, lwd=2, col = 2)
>
> abline(I3, B,
>lty=1, lwd=2, col = 3)
>
> legend("topleft", c("a"),
>inset=c(0,-0.07), xpd=TRUE, horiz=TRUE, bty="n"
> )
>
> I.nought = 26.34891
> I1 = I.nought + 0
> I2 = I.nought + 0.84785
> I3 = I.nought + -13.00021
> B  = -0.13421
>
> plot(x   = Presas$Lat,
>  y   = Presas$N,
>  col = Presas$Season,
>  pch = 16,
>  xlab = "Latitude",
>  ylab = "N")
>
> legend('topright',
>legend = levels(Presas$Season),
>col = 1:4,
>cex = 0.7,
>pch = 16)
>
> abline(I1, B,
>lty=1, lwd=2, col = 1)
>
> abline(I2, B,
>lty=1, lwd=2, col = 2)
>
> abline(I3, B,
>lty=1, lwd=2, col = 3)
>
> legend("topleft", c("b"),
>inset=c(0,-0.07), xpd=TRUE, horiz=TRUE, bty="n"
> )
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Etiquetas de valores en un bar_plot en las barras

2020-05-27 Por tema Carlos Ortega
Hola,

Puedes ver un ejemplo y código aquí:

https://www.r-graph-gallery.com/37-barplot-with-number-of-observation.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El jue., 28 may. 2020 a las 1:33, Ramiro Guzman ()
escribió:

> Buenas tardes, tengo un data frame con valores agregados de personas
> empleadas categorizados por 9 diferentes sectores económicos. Es decir mi
> data frame tiene 9 valores con dos variables, una con los diferentes 9
> sectores economicos y el otro la suma total de individuos que estan
> empleados.
>  Estoy intentando hacer un bar plot donde me muestre las etiquetas de los
> valores en cada barra de cada sector económico, el gráfico lo he podido
> hacer tanto con la función bar_plot como con el paquete ggplot.
> Los comandos para hacer los gráficos son los siguientes:
> Con comando bar_plot:
> barplot(diez$`sum(asegurados)`, main = "Empleados Formales por Sector al
> 10/2019", names.arg = c("Petroq", "Acero", "Alim", "Autom", "Cement",
> "Elec", "Papel", "Química", "Vidrio"), xlab = "Sector Económico", ylab =
> "Millones de Personas", col = "darkslateblue")
>
> Con comando ggplot:
> ggplot(diez, aes(x=se, y=`sum(asegurados)`))+geom_bar(stat = "identity")
>
> Como mencioné, solo busco indique en las barras por sector su valor
> individual, buscando me encontre con la función "text" la cual no estoy
> seguro si se pueda con esa.
>
>     [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tipo de gráfico idóneo

2020-05-21 Por tema Carlos Ortega
Hola,

Si quieres resaltar diferencias, que es lo que entendido que buscas, estos
gráficos me parece especialmente interesantes para ello:


   - https://www.r-graph-gallery.com/303-lollipop-plot-with-2-values.html
   -
   
https://cran.r-project.org/web/packages/interactions/vignettes/interactions.html#simple_slopes_analysis_and_johnson-neyman_intervals


Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue., 21 may. 2020 a las 19:15, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Esta vez no es un problema, pero quizás podáis aconsejarme sobre qué
> gráfico elegir, pues hice algunas pruebas y no queda muy bien.
> Quiero comparar 9 rectas (o lo que sea) hechas de tan solo dos puntos.
> Para 9 grupos de especies distintos tengo un dato para 2050 y otro para
> 2070, y pretendo que se aprecie bien la evolución (de tan solo dos fechas)
> de cada uno de los 9 grupos, y las diferencias entre grupos. Podría ser en
> un mismo gráfico o un gráfico para cada grupo, pero que permita visualizar
> las diferencias.
> Gracias, como siempre,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Graficos: como hacer que las etiquetas no estén sobrepuestas

2020-05-12 Por tema Carlos Ortega
Hola,
Sí, hay un paquete específicamente para tratar esto. "ggrepel":
https://cloud.r-project.org/web/packages/ggrepel/index.html

Claro tu gráfico tiene que ser ggplot.

Si no es ggplot, te recomiendo entonces que lo generes con el paquete
"factoextra" que sí que genera gráficos ggplot y puedes aplicar esta mejora
de ggrepel.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 12 may. 2020 a las 12:07, Yesica Pallavicini Fernandez (<
yesipa...@gmail.com>) escribió:

> Hola,
> Estoy haciendo un PCA con el paquete ade4.
> En el gráfico, las etiquetas de las especies suelen quedar
> sobrepuestas unas sobre las otras y no se pueden distinguir
> individualmente. ¿Hay alguna manera de generar un poco de espacio entre
> ellas para poder visualizarlas todas?
>
> gracias
> Yésica
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] character a factors

2020-05-09 Por tema Carlos Ortega
Hola,

Usa la función "factor()".

Saludos,
Carlos Ortega
www.qualityexcellence.es


El dom., 10 may. 2020 a las 0:35, Jose Betancourt B. ()
escribió:

>
> -- ?Como convertir variables definidas como character a factors en un csv?
>
> he usado as.factor(varibles) y no las convierte por lo que
> la librería MASS no me ejecuta el análisis mca
> saludos
> Jose
>
>
>
> Dr. Jose A. Betancourt Bethencourt
> Universidad de Ciencias Medicas Carlos j. Finlay
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problemas calculo muertes acumuladas mundo COVID-19 dplyr

2020-05-03 Por tema Carlos Ortega
Hola,

Mira la fecha, porque no tiene formato "Date", si no "character" y eso te
puede estar creando problemas.

Otra alternativa con data.table
#
library(data.table)
library(lubridate)
datdt <- as.data.table(datos)
datdt[ , fecha := dmy(dateRep)]
datdt[ , .(cas_cum = cumsum(cases)), by = .(fecha)][ , head(.SD[.N]), by =
.(fecha)]
#------

Saludos,
Carlos Ortega
www.qualityexcellence.es


El dom., 3 may. 2020 a las 20:41, Javier Gómez Gonzalez (<
zaraga...@gmail.com>) escribió:

> Hola a todos:
> Tengo problemas para calcular los casos acumulados y las muertes acumuladas
> para el mundo a partir de los datos diarios por paises de casos y muertes
> Los datos los estoy descargando del European Centre for Disease Prevention
> and Control
>
> library(utils)
> library(httr)
> GET("https://opendata.ecdc.europa.eu/covid19/casedistribution/csv;,
> authenticate(":", ":", type="ntlm"), write_disk(tf <- tempfile(fileext
> = ".csv")))
>
> # Creamos un dataframe con los datos descargados
> datos <- read.csv(tf)
>
> El ejemplo es para el 01-05-2020
> Lo que estoy haciendo es lo siguiente:
>
> # Calculamos las muertes acumuladas y los casos acumulados por países
> names(mundo)
> mundo_1 <- mundo %>%
>   group_by(pais) %>%
>   mutate(casos_totales=cumsum(casos_dia),
>muertes_totales=cumsum(muertes_dia) )%>% ungroup()
>
> # Creamos las variables casos dia, casos totales,
> # muertes dia y muertes totales por fecha
> mundo_2 <- mundo_1 %>%
>   group_by(fecha) %>%
>   summarise(casos_dia=sum(casos_dia),
> casos_totales=sum(casos_totales,na.rm=T),
> muertes_dia=sum(muertes_dia),
> muertes_totales=sum(muertes_totales)) %>% ungroup()
>
> Y el  problema que tengo es que para el 30-04-2020 los valores acumulados
> son menores que para el 29-04-2020
>
>
> * fecha*
>
> *casos_dia*
>
> *casos_totales*
>
> *muertes_dia*
>
> *muertes_totales*
>
> *123*
>
> 2020-05-01
>
> 83466
>
> 3213554
>
> 5519
>
> 232563
>
> *122*
>
> 2020-04-30
>
> 76380
>
> *2917171*
>
> *6412*
>
> 202769
>
> *121*
>
> 2020-04-29
>
> 72977
>
> 3053708
>
> 6513
>
> 220632
>
> *120*
>
> 2020-04-28
>
> 65432
>
> 2980731
>
> 4897
>
> 214119
>
> *119*
>
> 2020-04-27
>
> 83536
>
> 2915299
>
> 3926
>
> 209222
>
> *118*
>
> 2020-04-26
>
> 101716
>
> 2831763
>
> 6249
>
> 205296
>
>
>
> Muchas gracias
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Convex hulls para NMDS o PCoA

2020-05-03 Por tema Carlos Ortega
Hola,

No estoy del todo seguro si los gráficos que incluye puede contemplar lo
que pides, pero probaría el paquete "factoextra".
Puedes ver sus posibilidades aquí:

http://www.sthda.com/english/wiki/factoextra-r-package-easy-multivariate-data-analyses-and-elegant-visualization

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom., 3 may. 2020 a las 15:05, Fernando Archuby ()
escribió:

> Buenos días/tardes.
> Me encuentro analizando datos de abundancias de especies por muestras en un
> estudio paleontológico. He realizdo un análisis de agrupamiento con
> hclust() con distancia de Bray-Curtis, previo transformación de los datos.
> He realizado también un PCoA con la misma matriz de distancia, con el
> comando cmdscale(). A su vez, con los ejes del PCoA calculé un nMDS con
> metaMDS(). Les comparto dos consultas:
> - ¿Cómo puedo agregar los convex hulls de los clusters a los gráficos de
> ordenamiento, tanto PCoA como nMDS? Idealmente cada uno de un color
> diferente. De manera similar, es mi intención agregar convex hulls de
> variables discretas como tipo de estrato, que es el mismo caso de los
> clusters. En cualquier caso, cuento con un vector con cada variable con la
> que quiero graficar los convex hulls.
> - Hice nMDS con los ejes resultantes del PCoA con el fin de "aprovechar" la
> varianza contenida en los ejes 3 a n-1 del PCoA. ¿Es para ustedes una
> estrategia adecuada?
> Saludos,
> Fernando.
>
> --
>
> *Dr. Fernando M. Archuby*
> CONICET-UNLP
> Teléfono Personal: +54-221-15-6129667.
> farch...@gmail.com
> paleobiolo...@gmail.com
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Instalar paquetes no disponibles para la versión actual

2020-05-03 Por tema Carlos Ortega
Hola,

Una alternativa para evitar tener que instalarte todo de nuevo es usar
"RStudiio Cloud"  (https://rstudio.cloud/)

   - Acabo de instalarme el paquete que te interesa "forestFloor" en una de
   las versiones que en RStudio_Cloud está disponible (3.5.3). También está la
   3.6.0.
   - He tenido que instalar sus dependencias (Rcpp, kknn, randomForest,
   caret).
   - Para instalar "forestFloor" he subido la librería a RStudio Cloud (se
   puede sin problemas) e instalarla una vez estaban instaladas estas
   dependencias.
   - He ejecutado los ejemplos que aparecen en la ayuda de la función
   "forestFloor()".

Si el conjunto de datos no es muy pesado, puedes subirlo igualmente a tu
entorno en RStudio_Cloud (realmente un proyecto) y ejecutarlo todo ahí. Los
resultados igualmente te los puedes bajar.

Como referencia, en RStudio Cloud, uno puede tener en la misma cuenta
diferentes proyectos cada uno corriendo con versiones de R diferentes.
Tiene limitaciones de espacio (1Gb) y de ejecución, no puedes dejar algo
muy pesado corriendo durante mucho tiempo.

Comparto la idea de José sobre que la actualización a una nueva versión de
R tiene consecuencias, que te pueden dejar un tanto colgado tu código
previo. Creo que la comunidad está al tanto de esto y en particular
RStudio, de ahí que estén apostando por una gestión de entornos parecida a
la que existe en Python. En este sentido, su última apuesta es el paquete
"renv". Que es mejor que su anterior iniciativa (Packrat).

   - https://rstudio.github.io/renv/articles/renv.html

Otra alternativa interesante, para no cambiar tu entorno, aunque tiene la
limitación que su uso es en modo trial durante 45 días es esta:

   - https://rstudio.com/products/quickstart/

En este caso, te instalas en tu ordenador una máquina virtual con todos
estos productos: RStudio_Server_Pro, Connect y el Package Manager.
Como en el caso de RStudio_Cloud esta versión trial viene instalada con
varias versiones de R.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El jue., 30 abr. 2020 a las 18:16, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenas tardes. Tenía la versión 3.6.0 de R. Quería instalar el paquete
> edarf, pero decía que no estaba disponible para esa versión. Actualicé R a
> la versión 4.0.0, que creo que es la última, pero al tratar de reinstalar
> forestFloor, me dice que no está disponible para la versión 4.0.0. He
> abierto R 3.6.0 directamente, cliqueo install.packages("forestfloor") y
> ahora me dice que no está disponible para esa versión.
> A ver si me podéis echar una mano,
> Gracias,
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Posible SPAM] Re: Stopwords: Topic modelling con LDA

2020-04-30 Por tema Carlos Ortega
Hola Miriam,

No he visto que se use un filtro por defecto para el valor de tf-idf.

En tu caso, tendrás que ver cúal es ese punto de corte que te revela señal,
justo de los términos que te interesan.
Mira la distribución de palabras y su valor de tf-idf y selecciona tu corte.

Gracias,
Carlos.
www.qualityexcellence.es


El mié., 29 abr. 2020 a las 14:00,  escribió:

> Hola,
>
> Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o
> tf-idf que se considerara como umbral para establecer que una palabra es
> muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los
> de tf-idf ente 0 y 0.07.
>
> Un saludo
>
> El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió:
> > Hola,
> > Yo de primeras los quitaría para qué otros topics aparecen.
> >
> > Y también aplicaría tf-idf a tus comentarios. Con tf-idf seguro que
> > desaparecen como relevantes esas palabras comunes, será otra forma de
> > confirmar que es buena la decisión de hacer el análisis eliminandolas.
> >
> > Saludos,
> > Carlos Ortega
> >
> https://protection.puc.rediris.es/fmlurlsvc/?fewReq=:B:JVI2PTg1Nip6MT0iPCplaDE8PTY8PSp/ZWtibXh5fmkxNW1qPG49bm09PzluaDtpPzk9aG5uPj89bm0/bj06bjpvOWk7PDtuaSp4MT05NDQ8Oz0+Pz4qfWVoMTw/X01+fFVmPD47OTg0ITw/X01+fFVgPD47OTg0Kn5vfHgxYWV+ZW1hIm1gdm14aUx5Ym16bX5+bSJpfypvMTU8=http%3a%2f%2fwww.qualityecellence.es
> >
> > El mar., 28 abr. 2020 a las 11:44,  escribió:
> >
> >> Buenos días,
> >>
> >> Estoy realizando un análisis de topic models con el método LDA. En
> >> principio, he quitado del análisis las palabras "stopwords" universales.
> >> A
> >> la hora de ver los topics y sus palabras más frecuentes encuentro que
> >> son
> >> muy similares y hay palabras que aparecen en todos los topics. Los
> >> textos
> >> que estoy analizando son opiniones de consumidores sobre una categoría
> >> concreta de cosméticos, por lo que la temática es muy concreta y puede
> >> ser
> >> que en todas las opiniones se hable de cosas similares.
> >>
> >> Mi pregunta es,  incluiríais estas palabras que me aparecen en todos los
> >> topics o casi todos como stopwords?  Hay alguna forma de refinar más el
> >> análisis y que haya más diferencias entre topics?
> >>
> >> Este es el código que estoy usando:
> >>
> >> Reviews_dtm <-text_df12star %>%
> >>   unnest_tokens(word, text) %>%
> >>   anti_join(stop_words)%>%
> >>   count(Brand, word) %>%
> >>   cast_dtm(Brand, word, n)
> >>
> >>
> >> Reviews_lda <- LDA(Reviews12_dtm, k = 15, control = list(seed = 2016))
> >>
> >> Un saludo
> >>
> >> Miriam
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >
> > --
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
> >
>
>
>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Stopwords: Topic modelling con LDA

2020-04-28 Por tema Carlos Ortega
Hola,
Yo de primeras los quitaría para qué otros topics aparecen.

Y también aplicaría tf-idf a tus comentarios. Con tf-idf seguro que
desaparecen como relevantes esas palabras comunes, será otra forma de
confirmar que es buena la decisión de hacer el análisis eliminandolas.

Saludos,
Carlos Ortega
www.qualityecellence.es

El mar., 28 abr. 2020 a las 11:44,  escribió:

> Buenos días,
>
> Estoy realizando un análisis de topic models con el método LDA. En
> principio, he quitado del análisis las palabras "stopwords" universales. A
> la hora de ver los topics y sus palabras más frecuentes encuentro que son
> muy similares y hay palabras que aparecen en todos los topics. Los textos
> que estoy analizando son opiniones de consumidores sobre una categoría
> concreta de cosméticos, por lo que la temática es muy concreta y puede ser
> que en todas las opiniones se hable de cosas similares.
>
> Mi pregunta es, ¿incluiríais estas palabras que me aparecen en todos los
> topics o casi todos como stopwords? ¿Hay alguna forma de refinar más el
> análisis y que haya más diferencias entre topics?
>
> Este es el código que estoy usando:
>
> Reviews_dtm <-text_df12star %>%
>   unnest_tokens(word, text) %>%
>   anti_join(stop_words)%>%
>   count(Brand, word) %>%
>   cast_dtm(Brand, word, n)
>
>
> Reviews_lda <- LDA(Reviews12_dtm, k = 15, control = list(seed = 2016))
>
> Un saludo
>
> Miriam
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Normalidad variable > 5000 observaciones

2020-04-26 Por tema Carlos Ortega
Hola,

Aquí tienes una forma alternativa:

https://stackoverflow.com/questions/17125458/r-shapiro-test-cannot-deal-with-more-than-5000-data-points

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 26 abr. 2020 a las 12:11, Rafael Santamaria (<
rsantamar...@gmail.com>) escribió:

> Hola!
>
> Necesito evaluar la normalidad de una variable para la que tengo más de
> 5000 observaciones.
>
> Shapiro-Wilks no funciona para muestras mayores 5000 observaciones.
>
> AAlshap <- lapply(AAdf, shapiro.test)
> Error in FUN(X[[i]], ...) : sample size must be between 3 and 5000
>
> Alguna sugerencia?
>
> Gracias.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] desagregar distribución de frecuencias

2020-04-14 Por tema Carlos Ortega
Hola,

Sí, esta es una forma...


> dat_freq <- data.frame(
+   val = c(8, 8.5, 9, 10, 10.5, 11, 11.5),
+   freq = c(1, 3, 5, 7, 4, 2, 1)
+ )
>
> rep(dat_freq$val, dat_freq$freq)
 [1]  8.0  8.5  8.5  8.5  9.0  9.0  9.0  9.0  9.0 10.0 10.0 10.0 10.0 10.0
10.0 10.0 10.5 10.5 10.5 10.5 11.0
[22] 11.0 11.5

Gracias,
Carlos Ortega
www.qualityexcellence.es




El mar., 14 abr. 2020 a las 21:40, ANA VENTERO MARTIN ()
escribió:

> Hola a tod@s,
> Trabajo con datos de abundancia (número de individuos) por tallas
> (medidas al medio centímetro inferior) de diferentes especies de peces
> y mis datos base son el número medido de peces por talla. Necesitaría
> vuestra ayuda para transformar las distribuciones de frecuencias de
> talla a los datos brutos que las generaían.
> Es decir, pasar de algo como esto
> 8   1
> 8.53
> 9  5
> 107
> 10.5 4
> 112
> 11.5 1
> A esto
> 8
> 8.5
> 8.5
> 8.5
> 9
> 9
> 9
> 9
> 9
> 10
> 10
> 10
> 10
> 10
> 10
> 10
> 10.5
> 10.5
> 10.5
> 10.5
> 11
> 11
> 11.5
> Gracias de antemano y mucho ánimo para estos tiempos inciertos que vivimos.
> Ana
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] (sin asunto)

2020-04-14 Por tema Carlos Ortega
Hola Manuel,

Prueba a forzar la salida del gráfico de ggplot con "print(pyt)".

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 14 abr. 2020 a las 19:49, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Hola de nuevo, hago un mapa con ggplot:
>
> pyt<-ggplot(data, aes(x = longitud, y = latitud)) +
> geom_point(aes(color = factor(ptyrup)))
> windows();pyt
>
> y después hago un loop con for. En vez de  print(i), que me indica por
> dónde va el loop,  me gustaría que me fuera añadiendo una línea vertical al
> mapa en la longitud que corresponde a i. Con plot () es muy fácil:
> abline(v=i), pero con ggplot, no me añade la línea, y si hago un nuevo mapa
> con la nueva línea, me borra la anterior.
>
> Creía haberlo solucionado incluyendo en el loop:
>
>   pyt <- pyt+
>   geom_vline(xintercept = i)
>   pyt
>
> Pero tampoco funciona. Es extraño, pues sale bien si hago yo las
> iteraciones, una a una, pero cuando hago el loop no dibuja las líneas.
>
> Gracias, una vez más,
> Manuel
>
>
>
> Muchas gracias, como siempre.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema Carlos Ortega
Hola,

Te sale error porque has cargado el fichero con read.csv().
Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
El error que obtienes es porque el objeto df (igual que datos) no es un
data.table.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
javier.ruben.marcu...@gmail.com>) escribió:

> Eric
>
> ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> errores. Copio y pego todo como me sale en la consola.
>
> > #
>
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > datos <-
> read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> >
> > library(data.table)
> > library(ggplot2)
> > library(anytime)
> >
> > df <-datos
> >
> > df[, fec:=anytime(fec)]
> Error in `:=`(fec, anytime(fec)) :
>   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...) are
> defined for use in j, once only and in particular ways. See help(":=").
> > setkey(df,com,fec)
> Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
>   x is not a data.table
> >
> > # newc: son los nuevos casos
> > df[, newc:=ct - shift(ct), by=.(com)]
> Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by = .(com)) :
>   unused argument (by = .(com))
> >
> > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> >
> > df[, tasa:=newc/ct, by=.(com)]
> Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
>   unused argument (by = .(com))
>
> El dom., 22 mar. 2020 a las 16:52, neo ()
> escribió:
>
> > Hola Javier, yo lo hice de la siguiente forma:
> >
> > library(data.table)
> > library(ggplot2)
> > library(anytime)
> >
> > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > df[, fec:=anytime(fec)]
> > setkey(df,com,fec)
> >
> >  # newc: son los nuevos casos
> > df[, newc:=ct - shift(ct), by=.(com)]
> >
> >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> >
> > df[, tasa:=newc/ct, by=.(com)]
> >
> >
> > y obtuve lo siguiente:
> >
> >
> > fec   com pob ct newc tasa
> > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> > 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> > 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> > 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> > 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> > 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> > 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
> >
> > Espero que te sirva.
> >
> > Saludos !!
> >
> > Eric.
> >
> >
> >
> >
> > On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > > Hola:
> > >
> > > Tengo los datos diarios del número de casos de coronavirus por
> > comunidades
> > > autónomas y quiero calcular el número diario de nuevos casos y la tasa
> > > diaria de variación del número de casos y no se como hacerlo en R.
> > >
> > > *fecha*
> > >
> > > *comunidad*
> > >
> > > *poblacion*
> > >
> > > *casos_totales*
> > >
> > > 04/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 13
> > >
> > > 05/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 12
> > >
> > > 06/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 21
> > >
> > > 04/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 0
> > >
> > > 05/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 1
> > >
> > > 06/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 6
> > >
> > > 04/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 2
> > >
> > > 05/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 5
> > >
> > > 06/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 5
> > >
> > > Gracias
> > >
> > >   [[alternative HTML version deleted]]
> > >
> > > ___
> > > R-help-es mailing list
> > > R-help-es@r-project.org
> > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Bibliografía

2020-03-17 Por tema Carlos Ortega
En la Web de la Fundación tienen documentos en diferentes idiomas entre
ellos español:

https://cran.r-project.org/other-docs.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El mar., 17 mar. 2020 a las 6:23, Jorge Orenos ()
escribió:

> Estoy buscando bibliografía en español para la utilización de R. Gracias.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] conocer un elemento a partir de su rowname y colname

2020-03-12 Por tema Carlos Ortega
H, puedes poner un ejemplo... no lo entiendo muy bien...

Gracias,
Carlos
www.qualityexcellence.es

El jue., 12 mar. 2020 a las 12:26, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenos días erreros, tengo una df y necesito extraer un elemento de forma
> automática de una variable chr, pero no a partir de su posición en la df
> sino del nombre del caso y de la variable.
> Gracias, y que el coronavirus os pille bien sanos (pues no hay
> escapatoria).
> Manuel
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Nombrar primer columna data.frame

2020-03-05 Por tema Carlos Ortega
Hola,
Esa columna realmente son los rownames() de tu data.frame...
Y como tal la puedes incorporar de esta forma:

tu_df$tratamientos <- rownames(tu_df)

Saludos,
Carlos Ortega
www.qualityexcellence.es



El jue., 5 mar. 2020 a las 22:46, Andrés Hirigoyen (<
andreshirigo...@gmail.com>) escribió:

> Buenas trades, mi consulta es la siguiente:
> Al generar un data frame la primer columna siempre aparece sin etiqueta.
> Al guardar un objeto groups de la función aov en esa columna quedan los
> tratamientos. ¿Como es posible ponerle una etiqueta y trabajarla como una
> variable mas?
> Anexo un ejemplo.
>
> [image: image.png]
> muchas gracias
> --
> *Andrés Hirigoyen*
> * Prof. Ciencias Biológicas*
> *Ing. Agr. Forestal (MSc) *
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problemas con tinytex (base Latex)

2020-02-19 Por tema Carlos Ortega
O esta, creo que mejor:

https://stackoverflow.com/questions/33148587/r-cmd-check-latex-error-fatal-pdflatex-gui-framework-cannot-be-initialized



El jue., 20 feb. 2020 a las 0:01, Carlos Ortega ()
escribió:

> Aquí hay una posible solución...
>
>
> https://tex.stackexchange.com/questions/27138/how-can-i-fix-the-error-gui-framework-cannot-be-initialized-with-texniccenter
>
> El mié., 19 feb. 2020 a las 23:16, MAURICIO MARDONES (<
> mauricio.mardo...@ifop.cl>) escribió:
>
>> Esto...
>>
>> 2020-02-19 18:29:50,307-0300 INFO  pdflatex - starting with command line:
>> C:\Users\MAURIC~1.MAR\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe
>> -halt-on-error -interaction=batchmode
>> "C:/Users/mauricio.mardones/Documents/IFOP/FIPA
>> 2018-32/MSE/MSE_Clam_XI/OM_Clam_XI.tex"
>> 2020-02-19 18:29:50,318-0300 INFO  pdflatex - allowing known shell
>> commands
>> 2020-02-19 18:29:50,318-0300 INFO  pdflatex - enabling input (output)
>> from (to) processes
>> 2020-02-19 18:29:50,352-0300 INFO  pdflatex - going to create file:
>> pdflatex.fmt
>> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - GUI framework cannot be
>> initialized.
>> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Info:
>> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Source:
>> Libraries\MiKTeX\UI\Qt\mikuiqt.cpp
>> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Line: 77
>> 2020-02-19 18:29:54,568-0300 INFO  pdflatex - finishing with exit code 1
>> 2020-02-19 18:29:54,571-0300 FATAL pdflatex - major issue: So far, you
>> have not checked for MiKTeX updates.
>> 2020-02-19 18:40:38,146-0300 INFO  pdflatex - starting with command line:
>> C:\Users\MAURIC~1.MAR\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe
>> -halt-on-error -interaction=batchmode script_LBSPR_VenusRMD.tex
>> 2020-02-19 18:40:38,153-0300 INFO  pdflatex - allowing known shell
>> commands
>> 2020-02-19 18:40:38,153-0300 INFO  pdflatex - enabling input (output)
>> from (to) processes
>> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - GUI framework cannot be
>> initialized.
>> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Info:
>> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Source:
>> Libraries\MiKTeX\UI\Qt\mikuiqt.cpp
>> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Line: 77
>> 2020-02-19 18:40:38,307-0300 INFO  pdflatex - finishing with exit code 1
>> 2020-02-19 18:40:38,308-0300 FATAL pdflatex - major issue: So far, you
>> have not checked for MiKTeX updates.
>>
>>
>>
>> On Wed, Feb 19, 2020 at 7:07 PM Carlos Ortega 
>> wrote:
>>
>>> Mira el error en este fichero que te indica:
>>>
>>> * C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*
>>>
>>> Ahí vendrá en las últimas líneas el fallo que se ha producido.
>>> Y con el mensaje de error específico busca si hay alguna referencia por
>>> ahí.
>>>
>>> Entiendo que estás instalando la última versión que ha salido hace pocos
>>> días...
>>>
>>> El mié., 19 feb. 2020 a las 22:36, MAURICIO MARDONES (<
>>> mauricio.mardo...@ifop.cl>) escribió:
>>>
>>>> Etimados
>>>>
>>>> Gracias por las respuestas.
>>>>
>>>> De hecho yo antes tenía instalado Miktex, (casi 3 años trabajando y
>>>> bien), pero durante la última semana me salio este error cuando hice el
>>>> knirt;
>>>>
>>>> !* Sorry, but
>>>> C:\~\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe did not
>>>> succeed.*
>>>> *! The log file hopefully contains the information to get MiKTeX going
>>>> again:*
>>>> *!   C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*
>>>> *! pdflatex: major issue: So far, you have not checked for MiKTeX
>>>> updates.*
>>>>
>>>> El punto es que trate de hacer las actualizaciones y me hizo problemas
>>>> la consola de Miktex con el mirrow cran. Lo cual no pude solucionar,
>>>> por ello pasé a tinytex, pero por lo que uds me han dicho, he quedado
>>>> peor. Ahora volví a instalar Miktex y me sigue saliendo el
>>>> mismo error. Saben porque sería?
>>>>
>>>> Saludos
>>>>
>>>> On Wed, Feb 19, 2020 at 6:19 PM Javier Marcuzzi <
>>>> javier.ruben.marcu...@gmail.com> wrote:
>>>>
>>>>> Estimado Mauricio Mardones
>>>>>
>>>>> Me llamo la atención su correo, desconocía lo que usted nombra, lo
>>>>> 

Re: [R-es] Problemas con tinytex (base Latex)

2020-02-19 Por tema Carlos Ortega
Aquí hay una posible solución...

https://tex.stackexchange.com/questions/27138/how-can-i-fix-the-error-gui-framework-cannot-be-initialized-with-texniccenter

El mié., 19 feb. 2020 a las 23:16, MAURICIO MARDONES (<
mauricio.mardo...@ifop.cl>) escribió:

> Esto...
>
> 2020-02-19 18:29:50,307-0300 INFO  pdflatex - starting with command line:
> C:\Users\MAURIC~1.MAR\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe
> -halt-on-error -interaction=batchmode
> "C:/Users/mauricio.mardones/Documents/IFOP/FIPA
> 2018-32/MSE/MSE_Clam_XI/OM_Clam_XI.tex"
> 2020-02-19 18:29:50,318-0300 INFO  pdflatex - allowing known shell commands
> 2020-02-19 18:29:50,318-0300 INFO  pdflatex - enabling input (output) from
> (to) processes
> 2020-02-19 18:29:50,352-0300 INFO  pdflatex - going to create file:
> pdflatex.fmt
> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - GUI framework cannot be
> initialized.
> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Info:
> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Source:
> Libraries\MiKTeX\UI\Qt\mikuiqt.cpp
> 2020-02-19 18:29:54,568-0300 FATAL pdflatex - Line: 77
> 2020-02-19 18:29:54,568-0300 INFO  pdflatex - finishing with exit code 1
> 2020-02-19 18:29:54,571-0300 FATAL pdflatex - major issue: So far, you
> have not checked for MiKTeX updates.
> 2020-02-19 18:40:38,146-0300 INFO  pdflatex - starting with command line:
> C:\Users\MAURIC~1.MAR\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe
> -halt-on-error -interaction=batchmode script_LBSPR_VenusRMD.tex
> 2020-02-19 18:40:38,153-0300 INFO  pdflatex - allowing known shell commands
> 2020-02-19 18:40:38,153-0300 INFO  pdflatex - enabling input (output) from
> (to) processes
> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - GUI framework cannot be
> initialized.
> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Info:
> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Source:
> Libraries\MiKTeX\UI\Qt\mikuiqt.cpp
> 2020-02-19 18:40:38,307-0300 FATAL pdflatex - Line: 77
> 2020-02-19 18:40:38,307-0300 INFO  pdflatex - finishing with exit code 1
> 2020-02-19 18:40:38,308-0300 FATAL pdflatex - major issue: So far, you
> have not checked for MiKTeX updates.
>
>
>
> On Wed, Feb 19, 2020 at 7:07 PM Carlos Ortega 
> wrote:
>
>> Mira el error en este fichero que te indica:
>>
>> * C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*
>>
>> Ahí vendrá en las últimas líneas el fallo que se ha producido.
>> Y con el mensaje de error específico busca si hay alguna referencia por
>> ahí.
>>
>> Entiendo que estás instalando la última versión que ha salido hace pocos
>> días...
>>
>> El mié., 19 feb. 2020 a las 22:36, MAURICIO MARDONES (<
>> mauricio.mardo...@ifop.cl>) escribió:
>>
>>> Etimados
>>>
>>> Gracias por las respuestas.
>>>
>>> De hecho yo antes tenía instalado Miktex, (casi 3 años trabajando y
>>> bien), pero durante la última semana me salio este error cuando hice el
>>> knirt;
>>>
>>> !* Sorry, but
>>> C:\~\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe did not
>>> succeed.*
>>> *! The log file hopefully contains the information to get MiKTeX going
>>> again:*
>>> *!   C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*
>>> *! pdflatex: major issue: So far, you have not checked for MiKTeX
>>> updates.*
>>>
>>> El punto es que trate de hacer las actualizaciones y me hizo problemas
>>> la consola de Miktex con el mirrow cran. Lo cual no pude solucionar,
>>> por ello pasé a tinytex, pero por lo que uds me han dicho, he quedado
>>> peor. Ahora volví a instalar Miktex y me sigue saliendo el mismo error.
>>> Saben porque sería?
>>>
>>> Saludos
>>>
>>> On Wed, Feb 19, 2020 at 6:19 PM Javier Marcuzzi <
>>> javier.ruben.marcu...@gmail.com> wrote:
>>>
>>>> Estimado Mauricio Mardones
>>>>
>>>> Me llamo la atención su correo, desconocía lo que usted nombra, lo
>>>> busque, pero hay una diferencia, instala textlive en un lugar del disco
>>>> (.appdata), yo opino como Carlos Ortega.
>>>>
>>>> La documentación dice:
>>>>  # Windows
>>>> tlmgr path remove rd /s /q "%APPDATA%\TinyTeX"
>>>>
>>>> Se instala en esa carpeta oculta.
>>>>
>>>> Saludos
>>>>
>>>> Javier Rubén Marcuzzi
>>>>
>>>> El mié., 19 feb. 2020 a las 17:58, Carlos Ortega (<
>>>> c...@qualityexcellence.es>) escribió:
>>>>
>>>>> 

Re: [R-es] Problemas con tinytex (base Latex)

2020-02-19 Por tema Carlos Ortega
Mira el error en este fichero que te indica:

* C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*

Ahí vendrá en las últimas líneas el fallo que se ha producido.
Y con el mensaje de error específico busca si hay alguna referencia por ahí.

Entiendo que estás instalando la última versión que ha salido hace pocos
días...

El mié., 19 feb. 2020 a las 22:36, MAURICIO MARDONES (<
mauricio.mardo...@ifop.cl>) escribió:

> Etimados
>
> Gracias por las respuestas.
>
> De hecho yo antes tenía instalado Miktex, (casi 3 años trabajando y bien),
> pero durante la última semana me salio este error cuando hice el knirt;
>
> !* Sorry, but
> C:\~\AppData\Local\Programs\MIKTEX~1.9\miktex\bin\x64\pdflatex.exe did not
> succeed.*
> *! The log file hopefully contains the information to get MiKTeX going
> again:*
> *!   C:~\AppData\Local\MiKTeX\2.9\miktex\log\pdflatex.log*
> *! pdflatex: major issue: So far, you have not checked for MiKTeX updates.*
>
> El punto es que trate de hacer las actualizaciones y me hizo problemas la
> consola de Miktex con el mirrow cran. Lo cual no pude solucionar, por
> ello pasé a tinytex, pero por lo que uds me han dicho, he quedado peor. Ahora
> volví a instalar Miktex y me sigue saliendo el mismo error. Saben porque
> sería?
>
> Saludos
>
> On Wed, Feb 19, 2020 at 6:19 PM Javier Marcuzzi <
> javier.ruben.marcu...@gmail.com> wrote:
>
>> Estimado Mauricio Mardones
>>
>> Me llamo la atención su correo, desconocía lo que usted nombra, lo
>> busque, pero hay una diferencia, instala textlive en un lugar del disco
>> (.appdata), yo opino como Carlos Ortega.
>>
>> La documentación dice:
>>  # Windows
>> tlmgr path remove rd /s /q "%APPDATA%\TinyTeX"
>>
>> Se instala en esa carpeta oculta.
>>
>> Saludos
>>
>> Javier Rubén Marcuzzi
>>
>> El mié., 19 feb. 2020 a las 17:58, Carlos Ortega (<
>> c...@qualityexcellence.es>) escribió:
>>
>>> Visto que estás en un "bucle pantanoso" ¿por qué no pruebas justamente a
>>> instalarte MikTex?.
>>> Yo lo instalé (Mac) cuando vi que no podía convertir rMarkdowns a pdfs y
>>> desde aquel momento no he tenido ningún problema.
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El mié., 19 feb. 2020 a las 21:47, MAURICIO MARDONES (<
>>> mauricio.mardo...@ifop.cl>) escribió:
>>>
>>> > Estimados erreros,
>>> >
>>> > Llevo dos días en un bucle pantanoso tratando de resolver mi tema y no
>>> > puedo y les queria pedir ayuda.
>>> >
>>> > Hace una semana ya no puedo transformar archivos a pdf desde RMarkdown
>>> y he
>>> > tenido que tratar de instalar "tinytex", que es la solución para los
>>> > usuarios de R y pasar por alto el complejo MikTex (
>>> > https://yihui.org/tinytex/). Sin embargo, al tratar de instalar me
>>> arroja
>>> > este error;
>>> >
>>> >
>>> > *Automated TeX Live installation using profile: ../tinytex.profile*
>>> > *cannot contact mirror.ctan.org <http://mirror.ctan.org>, returning a
>>> > backbone server!*
>>> > *Loading
>>> >
>>> http://www.ctan.org/tex-archive/systems/texlive/tlnet/tlpkg/texlive.tlpdb
>>> > <
>>> http://www.ctan.org/tex-archive/systems/texlive/tlnet/tlpkg/texlive.tlpdb
>>> > >*
>>> >
>>> > *Error in setwd(dir) : cannot change working directory*
>>> > *In addition: Warning message:*
>>> > *In file.remove("TinyTeX/install-tl.log") :*
>>> > *  cannot remove file 'TinyTeX/install-tl.log', reason 'No such file or
>>> > directory'*
>>> >
>>> >
>>> > Uds han podido resolver esto? He leído (creo) todos los foros y nada.
>>> Si
>>> > alguien ha pasado por esto, le agradezco la ayuda para salir del
>>> túnel...
>>> >
>>> > Saludos a todos
>>> >
>>> > --
>>> >
>>> > *Mauricio Mardones Inostroza*
>>> >
>>> > Investigador Departamento Evaluación de Recursos
>>> > Instituto de Fomento Pesquero - IFOP
>>> > Valparaíso - Chile
>>> > +56-32-21514 42
>>> >
>>> > www.ifop.cl
>>> >
>>> > --
>>> > C*ertificación ISO 9001/2015*: Sistema de Datos
>>> > Biológico-Pesqueros (Arica,
>>> > Iquique, Coquimbo, Valparaíso, San Antonio, Talcahuano y C

Re: [R-es] Problemas con tinytex (base Latex)

2020-02-19 Por tema Carlos Ortega
Visto que estás en un "bucle pantanoso" ¿por qué no pruebas justamente a
instalarte MikTex?.
Yo lo instalé (Mac) cuando vi que no podía convertir rMarkdowns a pdfs y
desde aquel momento no he tenido ningún problema.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mié., 19 feb. 2020 a las 21:47, MAURICIO MARDONES (<
mauricio.mardo...@ifop.cl>) escribió:

> Estimados erreros,
>
> Llevo dos días en un bucle pantanoso tratando de resolver mi tema y no
> puedo y les queria pedir ayuda.
>
> Hace una semana ya no puedo transformar archivos a pdf desde RMarkdown y he
> tenido que tratar de instalar "tinytex", que es la solución para los
> usuarios de R y pasar por alto el complejo MikTex (
> https://yihui.org/tinytex/). Sin embargo, al tratar de instalar me arroja
> este error;
>
>
> *Automated TeX Live installation using profile: ../tinytex.profile*
> *cannot contact mirror.ctan.org <http://mirror.ctan.org>, returning a
> backbone server!*
> *Loading
> http://www.ctan.org/tex-archive/systems/texlive/tlnet/tlpkg/texlive.tlpdb
> <http://www.ctan.org/tex-archive/systems/texlive/tlnet/tlpkg/texlive.tlpdb
> >*
>
> *Error in setwd(dir) : cannot change working directory*
> *In addition: Warning message:*
> *In file.remove("TinyTeX/install-tl.log") :*
> *  cannot remove file 'TinyTeX/install-tl.log', reason 'No such file or
> directory'*
>
>
> Uds han podido resolver esto? He leído (creo) todos los foros y nada. Si
> alguien ha pasado por esto, le agradezco la ayuda para salir del túnel...
>
> Saludos a todos
>
> --
>
> *Mauricio Mardones Inostroza*
>
> Investigador Departamento Evaluación de Recursos
> Instituto de Fomento Pesquero - IFOP
> Valparaíso - Chile
> +56-32-21514 42
>
> www.ifop.cl
>
> --
> C*ertificación ISO 9001/2015*: Sistema de Datos
> Biológico-Pesqueros (Arica,
> Iquique, Coquimbo, Valparaíso, San Antonio, Talcahuano y Calbuco,
> pesquerías industriales y artesanales)
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] update package grDevices del grupo base de R

2020-02-19 Por tema Carlos Ortega
Hola,

No sé si será posible con MRO, pero con los paquetes oficiales de CRAN
puedes bajártelos (los tar.gz) y compilarles usando las RTools.
El equivalente sería que MRO tuviera alguna utilidad parecida con la que
pudieras coger los paquetes oficiales y con esa utilidad compilar el
paquete para adecuarle a las necesidades de su versión de R.

En cualquier caso, puedes trasladar esta duda en su página de
soporte/Community, por si esta alternativa es posible.


Gracias,
Carlos Ortega
www.qualityexcellence.es

El mié., 19 feb. 2020 a las 16:17, patricio fuenmayor (<
patricio.fuenma...@gmail.com>) escribió:

> Buen día.
> Se me presentó un inconveniente con la actualización de un paquete. El
> error que me aparece es:
> Error : object 'hcl.colors' is not exported by 'namespace:grDevices'
> grDevices es un paquete que se instala por defecto y es parte del base de
> R.
> Consulté y el problema es que el paquete al que quiero hacer el update
> utiliza la ultima versión del grDevices, es decir de la versión 3.6.2 de R
> Yo estoy usando la versión 3.5.3 del MRO Microsoft y no puedo realizar el
> upgrade de esta versión (por el uso del multicore).
> MI pregunta es ¿cómo puedo hacer el update de la última versión del paquete
> grDevices en la version 3.5.3 MRO que tengo instalada?.
> Gracias por la ayuda
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Colocar objeto Dates dentro de un vector.

2020-02-15 Por tema Carlos Ortega
Hola,

Una alternativa que te puede ayudar es enfocar el problema de esta otra
forma.
Puedes ir guardando tus vectores "original" en un data.frame y luego
convertirlo a fechas.

Una vez tienes estas fechas, puedes hacer cálculos o extraer otras
variables.


> original<-c(2019,308,1700, 25)
> df <- data.frame(
+   Year = original[1],
+   DayNum = original[2],
+   Hour = original[3]
+ )
> my_fecha <- strptime( paste(df$Year, df$DayNum, df$Hour, sep = ""),
"%Y%j%H" )
> my_fecha
[1] "2019-11-04 17:00:00 CET"
> my_fecha <- strptime( paste(original[1], original[2], original[3], sep =
""), "%Y%j%H" )
> my_fecha
[1] "2019-11-04 17:00:00 CET"

Gracias,
Carlos Ortega
www.qualityexcellence.es


El sáb., 15 feb. 2020 a las 12:45, Jaume Tormo ()
escribió:

> Hola,
>
> Estoy encontrando un problema al intentar poner un objeto Dates en un
> vector o dataframe.
> Mi ejemplo
> # preliminares
>   install.packages( lubridate ); library( lubridate )
>   v <- c(0, 0, 0)
>   original<-c(2019,308,1700, 25) # c(año, día del año, hora, temperatura)
> esto sale así de un sensor de temperatura
>
> # convertimos los datos originales en algo que entienda R
>   a <- years(original[1] )
>   d <- days(original[2]-1 ) # el -1 es un ajuste por como son los datos
> originales
>   h <- hours( substr(original[3], 1, 2) )
>   fecha <- a+d+h # Conseguimos una fecha completa
>   fecha.b <- as.Date(fecha, origin="-01-01" ) # convertimos la fecha en
> días del mes en lugar de días del año
> # mi problema
>   # Si asigno fecha a un elemento de un vector me sale 0
>   v[2] <- fecha
>   v[2]
>   # Si asigno fecha.b a un elemento de un vector me da un error
>   v[1] <- fecha.b
>   Me da cosas parecidas si intento asignar un lugar en un dataframe,
>
> Entiendo que as.Date convierte la fecha en algo que tiene más de un
> elemento ¿Puede ser eso? Si es así ¿Cómo veo lo que hay dentro del objeto
> para sacar solo lo que me interese?
>
> Muchas gracias.
>
> --
> Jaume Tormo.
> https://es.linkedin.com/in/jaumetormo
> https://acercad.wordpress.com/
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Hoy "Reunión del Grupo de Usuarios de R de Madrid".

2020-02-14 Por tema Carlos Ortega
Hola,
¡Gracias a todos los que pudísteis venir y a los ponentes!.
El material y los videos de la sesión ya están disponibles aquí:

http://madrid.r-es.org/64-jueves-13-de-febrero-2019/

Nos vemos pronto,
Carlos Ortega
www.qualityexcellence.es

El jue., 13 feb. 2020 a las 9:13, Carlos Ortega ()
escribió:

> Hola,
> ¿Qué tal?
>
> Para todos aquellos que estén en Madrid y que quieran/puedan pasarse, esta
> tarde tendremos "Reunión del Grupo de Usuarios de R Madrid".
>
> Los detalles están aquí:
>
>
> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madrid/events/268560806/
>
> Invitados estáis!.
>
> Gracias,
> Carlos.
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Hoy "Reunión del Grupo de Usuarios de R de Madrid".

2020-02-13 Por tema Carlos Ortega
Hola,
¿Qué tal?

Para todos aquellos que estén en Madrid y que quieran/puedan pasarse, esta
tarde tendremos "Reunión del Grupo de Usuarios de R Madrid".

Los detalles están aquí:

https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madrid/events/268560806/

Invitados estáis!.

Gracias,
Carlos.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cannot allocate a vector of size...

2020-02-10 Por tema Carlos Ortega
Hola Miriam,

Puedes hacer varias cosas para salir al paso:

   - El flujo proceso que se suele seguir en este tipo de análisis es el de
   cargar todos los documentos a una gran matriz (documento/palabra) sobre la
   que luego te quitas muchas palabras "inútiles" (las stopwords). Pues lo que
   puedes hacer de primeras, es sobre tus ficheros de palabras de entrada
   limpiarles y quitarles estas palabras (preposiciones, artículos y
   adverbios) con esto minimizas mucho el número de palabras a representar.
   También habrá palabras que en tu tipo de análisis significarán poco (me lo
   invento la palabra "producto" por ejemplo).
  - ¿Cómo limpio esto en mis ficheros?. Puedes hacerlo con cierta
  facilidad utilizando comandos de linux (grep, sed en particular).
  - Una vez que has limpiado todo esto, puedes volver a probar a cargar
  el nuevo fichero en "tm" y proceder con el análisis. Si es que tu memoria
  RAM (no el disco como te han dicho) es la suficiente.
  - Realmente, si estás interesada en conocer la frecuencia de palabras
 para luego pintar una "inútil" nube de palabras, puedes
incluso calcular la
 frecuencia de aparición igualmente con un comando de linux (unique). Y
 luego usar el paquete "wordcloud2" para pintar la nubecita. :-).
  - Como alternativa, como supongo que querrás analizar sentimiento, y
   estas cosa o incluso ver POS cambiaría de tercio y no usaría "tm" me
   pasaría a la librería "udpipe" o en su defecto a la librería (tidytext) del
   que Julia Silge (su autora, tiene su libro de cómo usar su librería en
   abierto:
   https://www.tidytextmining.com/tidytext.html#the-unnest_tokens-function).


Saludos,
Carlos Ortega
www.qualityexcellence.es



El lun., 10 feb. 2020 a las 17:20, Xavier-Andoni Tibau Alberdi (<
xaviti...@gmail.com>) escribió:

> Me temo que no tengo demasiada experiencia en trabajar con sparse matrix en
> R. Definitivamente cuando haces 'as.matrix(x)' estas convirtiendo x en una
> matriz normal, no sparse. He visto que existe el paquete slam para trabajar
> con ellas (documentación
> <https://www.rdocumentation.org/packages/slam/versions/0.1-47>). Deberías
> ver si las opciones del paquete te permiten hacer lo que quieres.
>
> Faltaría más información de que haces luego con la matriz, para poder saber
> si es posible dividir-la. Te pongo un ejemplo, si quieres calcular el valor
> promedio de las columnas, puedes dividir la matriz en dos, calcularlos por
> separado y luego juntar los resultados. Pero si tu matriz sirve para hacer
> una regresión lineal, no puedes, puesto que necesitas la inversa de la
> matriz y no se puede calcular a partir de dos mitades.
>
> A ver si con el paquete slam puedes continuar, sino deberías compartir que
> haces luego con la matriz para que podamos intentar aconsejarte.
>
> Saludos,
>
> Xavier Tibau
>
> Missatge de l'adreça  del dia dl., 10 de febr.
> 2020 a les 16:56:
>
> > Muchas gracias Xabier.
> >
> > He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me
> > dice también que "cannot allocate a vector of size 12 gb".
> > He hecho tdm<-as.matrix(tdm)
> >
> > ¿Está bien hecho eso para trabajar con la sparse matrix?
> >
> > Gracias!
> >
> > El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi
> escribió:
> > > La respuesta de Carlos creo que es mucho mas acertada que la mía.
> Cuando
> > > trabajas con una matriz mayoritariamente con 0s, puedes representar-la
> en
> > > forma de sparse matrix, y ocupa mucho menos espacio porque no guardas
> > > todos
> > > los valores, sino aquellos distintos de 0 y su posición.
> > >
> > > Estas construyendo la matriz sparse con esto:
> > >  tdm<-TermDocumentMatrix(corpus,control=list(weighting =weightTf))
> > >
> > > puedes ver aquí
> > > <
> >
> https://www.rdocumentation.org/packages/tm/versions/0.7-7/topics/TermDocumentMatrix
> > >
> > > la documentación.
> > >
> > > Al hacer esto, conviertes la matrz sparse a matriz normal y pones en
> > > memoria todos los 0s, que ahora ocupan espacio en la memoria volátil
> > (RAM)
> > > de tu ordenador.
> > > tdm.reviews.m<-as.matrix(tdm)
> > >
> > > Estamos hablando de memoria RAM, no del disco duro de tu ordenador.
> > >
> > > Entiendo que tal y como sugiere Carlos, (1) lo mejor es que antes de
> > pasar
> > > de sparse matrix a matriz normal, consideres en reducir la cantidad de
> > > columnas (o filas) de tu matriz. Imagino que es una matriz con
> > frecuencias
> > > de palabra

Re: [R-es] Numerar filas según valor en una columna

2020-02-10 Por tema Carlos Ortega
Hola,

No conozco de un paquete especial que haga lo que dices, pero vaya es un
problema que se puede resolver de una forma bastante directa.

Basta que a la vuelta, tengas las referencia del "Informante", la frase y
el id que has asignado, para cruzarlo con el dataframe original por estos
mismos campos. Estos cambios actuarían como claves (en el concepto de base
de datos) para realizar el cruce de dataframes.

Como ejemplo:

   - Pasas tu lista:
   - Uno de los casos interesantes que determinas es: "*Informante001
  frase(c)   TC3   Este me interesa*"
   - En la vuelta te tendrían que devolver, tan solo la línea (o las líneas
   que eran interesantes con los valores adicionales).
   - Informante001  frase(c)   TC3   A   a   12


Gracias,
Carlos Ortega
www.qualityexcellence.es

El lun., 10 feb. 2020 a las 14:45, Juan Abasolo ()
escribió:

> Hola, amigos;
>
> Les presento mi necesidad, a ver si ven cómo resolverla.
>
> Necesito saber el numero relativo de las filas de un data frame, para
> poderlos pasar como argumentos en unos scripts de Praat.
>
> Me pasaron un csv con esta estructura:
>
> Informante001  frase(a)
> Informante001  frase(b)
> Informante001  frase(c)   TC
> Informante001  frase(d)   TC
> Informante001  frase(e)   TC
> Informante001  frase(a)
> Informante001  frase(f)   TC
> Informante001  frase(g)
> Informante002  frase(h)
> Informante002  frase(a)
> Informante002  frase(i)   TC
> Informante002  frase(c)   TC
> Informante002  frase(j)
> Informante002  frase(k)
> Informante002  frase(l)   TC
> Informante003 ...
>
> En la que tengo informantes que dicen alguna cantidad de frases y algunas
> de esas las tengo que Tomar en Cuenta (TC) y otras no. Necesito asignarles
> a cada una de las frases a tomar en cuenta la cuantoava frase del
> informante es, para pasar esa información en otro programa...
>
> Informante001  frase(a) 1
> Informante001  frase(b) 2
> Informante001  frase(c)   TC3   Este me interesa
> Informante001  frase(d)   TC4   Este me interesa
> Informante001  frase(e)   TC5   Este me interesa
> Informante001  frase(a) 6
> Informante001  frase(f)   TC7   Este me interesa
> Informante001  frase(g) 8
> Informante002  frase(h) 1
> Informante002  frase(a) 2
> Informante002  frase(i)   TC3   Este me interesa
> Informante002  frase(c)   TC4   Este me interesa
> Informante002  frase(j) 5
> Informante002  frase(k) 6
> Informante002  frase(l)   TC7   Este me interesa
> ...
>
>  Que a su vez me tiene que devolver unos valores para el DataFrameOriginal
>
> Informante001  frase(a) 1
> Informante001  frase(b) 2
> Informante001  frase(c)   TC3   A   a   12
> Informante001  frase(d)   TC4   A   b   1
> Informante001  frase(e)   TC5   B   a   11
> Informante001  frase(a) 6
> Informante001  frase(f)   TC7   B   b   10
> Informante001  frase(g) 8
> Informante002  frase(h) 1
> Informante002  frase(a) 2
> Informante002  frase(i)   TC3   A   b   1
> Informante002  frase(c)   TC4   B   b   2
> Informante002  frase(j) 5
> Informante002  frase(k) 6
> Informante002  frase(l)   TC7   B   c   10
> ...
>
> No es la primera vez que me encuentro con una necesidad así, me hace
> suponer que abrá algún paquete para este tipo de trabajo.
>
> Querría hacerlo de una manera más eficiente que el cúmulo de torpezas al
> que estoy llegando.
>
> Gracias, desde ya
>
> Juan
>
>
> --
> Juan Abasolo
>
> Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea
> UPV/EHU
>
> Sarriena auzoa z/g 48940 - Leioa (Bizkaia)
>
> T: (+34) 94 601 7567
> Telegram: @JuanAbasolo
> Skype: abasolo72
>
> Tutoretza ordutegia <https://labur.eus/JAbasolo-tutoretzak>
> [blo <https://juanabasolo.netlify.com/>][gak
> <http://bosgarrena.blogspot.com/>]
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] A modern object-oriented machine learning framework in R

2020-01-04 Por tema Carlos Ortega
Hola Diego,

Ya, la nueva versión de "mlr" es mucho más modular que la versión anterior.
Y para poder usar los diferentes algoritmos ("learners") hay que cargar la
librería "mlr3learners" que no se invoca por defecto cuando usas "mlr3".

Mira este ejemplo reproducible que adjunto, antes de cargar la librería
(mlr3learners) y probar con "ranger" tuve el mismo mensaje de error que has
obtenido.
Es interesante mirar también la página donde están todos los algoritmos que
están contemplados ahora mismo.

#
#--
#--- RANGER
# Load available learners
# https://mlr3learners.mlr-org.com/
library(mlr3learners)

learner = mlr3::lrn("classif.ranger")
print(learner)
# available parameters:
learner$param_set$ids()

# create learning task
task_iris = TaskClassif$new(id = "iris", backend = iris, target = "Species")
task_iris

# load learner and set hyperparamter
learner = lrn("classif.ranger", num.trees = 100)

# train/test split
train_set = sample(task_iris$nrow, 0.8 * task_iris$nrow)
test_set = setdiff(seq_len(task_iris$nrow), train_set)

# train the model
learner$train(task_iris, row_ids = train_set)

# predict data
prediction = learner$predict(task_iris, row_ids = test_set)

# calculate performance
prediction$confusion

measure = msr("classif.acc")
prediction$score(measure)
#




Gracias,
Carlos Ortega
www.qualityexcellence.es

El sáb., 4 ene. 2020 a las 13:46, Diego Martín ()
escribió:

> Estimadísimo Carlos:
>
> Muchísimas gracias por responderme y
> hacerlo tan rápido. Contemplé esa posibilidad, es decir, que el
> hiperparámetro estuviera suponiendo un problema, y probé de esta forma:
>
> > learner <- lrn("classif.ranger", num.trees = 5, mtry = NULL)
>
> Error: Element with key 'classif.ranger' not found in DictionaryLearner!
>
> Pero obtuve el mismo error. Como muestro.
> Reconozco el error de imprecisión al plantear la duda, por no poner esta
> experiencia. Este resultado, por decirlo de alguna manera, me mueve a
> pensar que el problema está en el reposititorio de la librería mlr3, al
> buscar la técnica de clasificación.
>
> No sé si hay algo más que no he hecho,
> además de cargar las librerías que entiendo deben estar, es decir:
> library(ranger)
> library(mlr3)
>
> Agradeceré cualquier comentario que me
> hagáis. Gracias Carlos.
>
> Diego Martín-Oliva.
>     Geógrafo.
>
> PS. Hoja del libro sobre mlr3, donde estuve buscando los *Learners*
> integrados en el paquete.
>
>
> El vie., 3 ene. 2020 a las 23:42, Carlos Ortega ()
> escribió:
>
>> Hola Diego,
>>
>> El problema que estás teniendo es por el hiperparámetro "cp" que has
>> usado.
>>
>> Ese hiperparámetro es propio del algoritmo de árbol de decisión "rpart",
>> pero no de "ranger".
>> Mira los hiperparámetros propios de "ranger" y prueba con uno de ellos
>> (por ejemplo n.trees o también mtry).
>>
>> De igual forma, tienes el mismo problema usando xgboost que tampoco tiene
>> "cp" como hiperparámetro.
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El vie., 3 ene. 2020 a las 20:00, Diego Martín ()
>> escribió:
>>
>>> Estimados amigos:
>>>
>>>  Esta tarde he estado probando la librería
>>> mlr3, que me resulta muy interesante para trabajos de clasificación. En
>>> concreto, para entender su funcionamiento he probado un ejemplo simple
>>> (viene en CRAN). Sin embargo, cuando cambio el parámetro de clasifiación
>>> en
>>> la función de aprendizaje, me aparece el error siguiente:
>>>
>>>
>>> *Error: Element with key 'classif.ranger' not found in
>>> DictionaryLearner!*
>>>
>>>La situación es la siguiente:
>>>
>>> library(ranger)
>>> library(mlr3)
>>> task_iris <- TaskClassif$new(id = "iris",
>>>  backend = iris,
>>>  target = "Species",
>>>  positive = NULL)
>>> # learner <- lrn("classif.rpart", cp = 0.01)
>>> learner <- lrn("classif.ranger", cp = 0.01)
>>>
>>>  De 

Re: [R-es] A modern object-oriented machine learning framework in R

2020-01-03 Por tema Carlos Ortega
Hola Diego,

El problema que estás teniendo es por el hiperparámetro "cp" que has usado.

Ese hiperparámetro es propio del algoritmo de árbol de decisión "rpart",
pero no de "ranger".
Mira los hiperparámetros propios de "ranger" y prueba con uno de ellos (por
ejemplo n.trees o también mtry).

De igual forma, tienes el mismo problema usando xgboost que tampoco tiene
"cp" como hiperparámetro.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El vie., 3 ene. 2020 a las 20:00, Diego Martín ()
escribió:

> Estimados amigos:
>
>  Esta tarde he estado probando la librería
> mlr3, que me resulta muy interesante para trabajos de clasificación. En
> concreto, para entender su funcionamiento he probado un ejemplo simple
> (viene en CRAN). Sin embargo, cuando cambio el parámetro de clasifiación en
> la función de aprendizaje, me aparece el error siguiente:
>
>
> *Error: Element with key 'classif.ranger' not found in DictionaryLearner!*
>
>La situación es la siguiente:
>
> library(ranger)
> library(mlr3)
> task_iris <- TaskClassif$new(id = "iris",
>  backend = iris,
>  target = "Species",
>  positive = NULL)
> # learner <- lrn("classif.rpart", cp = 0.01)
> learner <- lrn("classif.ranger", cp = 0.01)
>
>  De forma que, no entiende, no halla,
> "classif.ranger". Lo cual no ocurre con "classif.rpart". Si bien es el que
> usa en el ejemplo de CRAN. No veo dónde está el problema. La librería
> "ranger" carga perfectamente, he consultado
> *https://mlr3book.mlr-org.com/list-learners.html
> <https://mlr3book.mlr-org.com/list-learners.html>*, y es una de las
> posibilidades.
>
> La ayuda de lrn(), con la que cuento cuando
> hago help("lrn"), en mi opinión no es precisa, y no se trata de que esté en
> inglés, se trata de que no va al grano y, de modo muy genéricio, habla del
> aprendizaje en esta librería.
>
> No corresponde, pero por curiosidad he empleado
> también la opción "classif.xgboost", y obtengo el mismo error. No me digan,
> por favor, que xgboost, no sirve para variables categóricas, lo sé, se
> trata solo de una prueba para ver si esa sí la encontraba en el directorio
> de la librería.
>
>Por adelantado agradezco a todos su atención a
> mi duda y, por supuesto, la dedicación que le otorguen.
>
>Gracias.
>        Diego Martín-Oliva.
>Geógrafo.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Error en salida de lubridate::seconds_to_period() en Rmarkdown

2020-01-03 Por tema Carlos Ortega
Hola,

Feliz Año!.
No sé porqué se produce, tiene pinta de bug.. pero puedes forzar a que la
salida sea como quieres así:


+ Duración total *`r sprintf('%2.0fM : %2.0fS',
round(minute(seconds_to_period(dato)),0),
round(second(seconds_to_period(dato)),0) )`*

Saludos,
Carlos Ortega
www.qualityexcellence.es

El vie., 3 ene. 2020 a las 8:20, Juan Abasolo ()
escribió:

> Buas y feliz año y decada nueva, compañeRos,
>
> Me estoy encontrando con un problema tonto que no consigo resolver.
>
> Explico, tengo un dato que necesito sacar en un documento con codigo on
> line y no me saca el resultado de consola.
>
> dato <- 2272.13
>
> round(lubridate::seconds_to_period(seconds(dato))), 0)
>
> En consola me da:
> "37M 52S"
>
> Pero en el documento
>
> ```Rmarkdown
>
> + Duración total `r round(lubridate::seconds_to_period(seconds(sum(dato))),
> 0)`
>
> ```
>
> Me da:
>
>- *Duración total 52*
>
> Lo de envolverlo en seconds() lo puse para ver si funciona, y no hay
> cambio. Daría lo mismo seconds_to_period(dato), pero lo dejé para mostrar
> que lo tomé en cuenta.
>
> ---
> En realidad y de momento, es un solo dato que lo puedo copiar a mano, pero
> la curiosidad mató al gato y a mí me pone nervioso
>
> Que sigan bien
>
> --
> Juan Abasolo
>
> Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea
> UPV/EHU
>
> Sarriena auzoa z/g 48940 - Leioa (Bizkaia)
>
> T: (+34) 94 601 7567
> Telegram: @JuanAbasolo
> Skype: abasolo72
>
> Tutoretza ordutegia <https://labur.eus/JAbasolo-tutoretzak>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] pawer law

2019-11-23 Por tema Carlos Ortega
Hola,

Una forma de hacerlo es esta:

#-
> my_pol <- function( n = 100, grad_ini = 1, grad_end = 5) {
+   val_rnd <- rnorm(n)
+   df <- data.frame(c(0))
+   for( i in grad_ini:grad_end) {
+df_tmp <- as.data.frame(val_rnd^i)
+df <- cbind(df, df_tmp)
+   }
+   df <- df[ , 2:ncol(df)]
+   names(df) <- paste("V_", grad_ini:grad_end, sep = "")
+   return(df)
+ }
>
> df_out <- my_pol(10, 3, 8)
> head(df_out)
   V_3  V_4   V_5  V_6   V_7
   V_8
1 -2.152566721 2.7793431004 -3.588622e+00 4.633543e+00 -5.982721e+00
7.724748e+00
2 -3.848810314 6.0316390414 -9.452445e+00 1.481334e+01 -2.321463e+01
3.638067e+01
3  0.681408379 0.5996207120  5.276498e-01 4.643174e-01  4.085866e-01
3.595450e-01
4 -0.003075413 0.0004472372 -6.503878e-05 9.458164e-06 -1.375439e-06
2.000211e-07
5 -0.620395129 0.5291244605 -4.512813e-01 3.848901e-01 -3.282662e-01
2.799727e-01
6  0.023210872 0.0066209750  1.888654e-03 5.387446e-04  1.536786e-04
4.383731e-05
#-

"caret" tiene un par de funciones "SLC14_1()" y "SLC14_2" con las que
puedes generar dataframes con diferentes variables correladas entre ellas,
te sugiero que las veas por si además de esta función que te incluyo, te
ayuda en otros posibles casos.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El sáb., 23 nov. 2019 a las 12:11, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Buenos días erreros, ¿sabe alguien cómo generar una df cuyas variables
> sigan una ley de potencias?
> Gracias
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ponderación de casos en R

2019-11-12 Por tema Carlos Ortega
Hola,

Sí, se me ocurre de primeras una opción para conseguirlo:

   - Pasar la tabla de frecuencias a un data.frame
   - Iterar sobre el data.frame y con la función "rep()" repetir el valor
   tantas veces como diga la frecuencia, agrupando el resultado en cada
   iteración.


Puedes hacerlo con este código:

#
# Creo una tabla de contingencia
set.seed(1234)
vect_or <- sample(1:10, 1000, replace = TRUE)
mi_tabl <- table(vect_or)

# Deshago la tabla
vec_df <- as.data.frame(mi_tabl)
myfun <- function(x) {
  res_fun <- rep(x[1], times = x[2])
  return(res_fun)
}
res_end <- as.numeric(unlist(apply(vec_df, 1, myfun)))
#--------

Saludos,
Carlos Ortega
www.qualityexcellence.es


El mar., 12 nov. 2019 a las 18:02, José Miguel Contreras (<
jmcontre...@ugr.es>) escribió:

>
> Hola a todos
>
> ¿Existe una forma directa de hacer la ponderación de casos de spss en R?
> Pasar de datos en forma de tabla de frecuencias a datos simpres repitiendo
> los datos tantas veces como diga la frecuencia???
>
> Saludos
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] R en aws via SageMaker/Notebook

2019-11-05 Por tema Carlos Ortega
OK.

Mira esta otra ayuda..

https://stackoverflow.com/questions/51858379/how-to-link-s3-bucket-to-sagemaker-notebook

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 5 nov. 2019 a las 7:53, Mabel Garcia ()
escribió:

> Muchas gracias por el enlace Carlos, me da error en el otro sentido, al
> cargar un fichero de S3 en Sagemaker.
>
> Disculpad que no había detallado que estoy trabajando con R en aws, via
> Sagemaker/Jupiter Notebook.
>
> Gracias,
> Mabel García
> ------
> *De:* Carlos Ortega 
> *Enviado:* martes, 5 de noviembre de 2019 0:27
> *Para:* Mabel Garcia 
> *Cc:* r-help-es@r-project.org 
> *Asunto:* Re: [R-es] aws SageMaker Notebook
>
> Hola,
>
> Aquí tienes algunas ideas:
>
>
> https://stackoverflow.com/questions/56799763/uploading-a-dataframe-to-aws-s3-bucket-from-sagemaker
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstackoverflow.com%2Fquestions%2F56799763%2Fuploading-a-dataframe-to-aws-s3-bucket-from-sagemaker=02%7C01%7C%7C53d9a34611cc4a73d73308d7617ea0c8%7C84df9e7fe9f640afb435%7C1%7C0%7C637085068795887632=So9pl3lK%2BypP0gIVROUH1z6rmfbjBQjv32ebFQWBgRE%3D=0>
>
> Acuérdate de que esta lista es de R... :-).
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es=02%7C01%7C%7C53d9a34611cc4a73d73308d7617ea0c8%7C84df9e7fe9f640afb435%7C1%7C0%7C637085068795897637=EZMOxeSlGgd30YXRKwXQD7cszej0G0T3bwNJQCA03RY%3D=0>
>
> El lun., 4 nov. 2019 a las 19:15, Mabel Garcia ()
> escribió:
>
> Hola,
>
> Alguien con experiencia en cargar ficheros csv en aws SageMaker con
> Instancia Notebook?
>
>
> Mabel García
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es=02%7C01%7C%7C53d9a34611cc4a73d73308d7617ea0c8%7C84df9e7fe9f640afb435%7C1%7C0%7C637085068795907648=S3H9ZsJ9wm9U5NUbyuIwY2aCmg02W%2FLqH1jZd%2Fzm4Tw%3D=0>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es=02%7C01%7C%7C53d9a34611cc4a73d73308d7617ea0c8%7C84df9e7fe9f640afb435%7C1%7C0%7C637085068795917653=%2BUSqKuwHL3sKyDHMNy8XWD%2FMuUXwy9%2B8EunO2a44JS0%3D=0>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


  1   2   3   4   5   6   7   8   >