Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema Javier Gómez Gonzalez
 Muchas gracias a todos por su ayuda.

Hace un rato antes de abrir el correo, he encontrado dos soluciones a mi
problema de como calcular el porcentaje de variación.
La primera es usando el paquete dplyr:
https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871

La segunda usando la función PercChange del paquete DataCombine
https://rdrr.io/cran/DataCombine/man/PercChange.html


El dom., 22 mar. 2020 a las 23:51, Carlos Ortega ()
escribió:

> Hola,
>
> Te sale error porque has cargado el fichero con read.csv().
> Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
> El error que obtienes es porque el objeto df (igual que datos) no es un
> data.table.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
> javier.ruben.marcu...@gmail.com>) escribió:
>
> > Eric
> >
> > ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> > errores. Copio y pego todo como me sale en la consola.
> >
> > > #
> >
> >
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > > datos <-
> > read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> > >
> > > library(data.table)
> > > library(ggplot2)
> > > library(anytime)
> > >
> > > df <-datos
> > >
> > > df[, fec:=anytime(fec)]
> > Error in `:=`(fec, anytime(fec)) :
> >   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...) are
> > defined for use in j, once only and in particular ways. See help(":=").
> > > setkey(df,com,fec)
> > Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
> >   x is not a data.table
> > >
> > > # newc: son los nuevos casos
> > > df[, newc:=ct - shift(ct), by=.(com)]
> > Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by = .(com)) :
> >   unused argument (by = .(com))
> > >
> > > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > >
> > > df[, tasa:=newc/ct, by=.(com)]
> > Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
> >   unused argument (by = .(com))
> >
> > El dom., 22 mar. 2020 a las 16:52, neo ()
> > escribió:
> >
> > > Hola Javier, yo lo hice de la siguiente forma:
> > >
> > > library(data.table)
> > > library(ggplot2)
> > > library(anytime)
> > >
> > > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > > df[, fec:=anytime(fec)]
> > > setkey(df,com,fec)
> > >
> > >  # newc: son los nuevos casos
> > > df[, newc:=ct - shift(ct), by=.(com)]
> > >
> > >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > >
> > > df[, tasa:=newc/ct, by=.(com)]
> > >
> > >
> > > y obtuve lo siguiente:
> > >
> > >
> > > fec   com pob ct newc tasa
> > > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> > > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> > > 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> > > 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> > > 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> > > 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> > > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> > > 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> > > 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
> > >
> > > Espero que te sirva.
> > >
> > > Saludos !!
> > >
> > > Eric.
> > >
> > >
> > >
> > >
> > > On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > > > Hola:
> > > >
> > > > Tengo los datos diarios del número de casos de coronavirus por
> > > comunidades
> > > > autónomas y quiero calcular el número diario de nuevos casos y la
> tasa
> > > > diaria de variación del número de casos y no se como hacerlo en R.
> > > >
> > > > *fecha*
> > > >
> > > > *comunidad*
> > > >
> > > > *poblacion*
> > > >
> > > > *casos_totales*
> > > >
> > > > 04/03/2020
> > > >
> > > > Andalucía
> > > >
> > > > 8414240
> > > >
> > > > 13
> > > >
> > > > 05/03/2020
> > > >
> > > > Andalucía
> > > >
> > > > 8414240
> > > >
> > > > 12
> > > >
> > > > 06/03/2020
> > > >
> > > > Andalucía
> > > >
> > > > 8414240
> > > >
> > > > 21
> > > >
> > > > 04/03/2020
> > > >
> > > > Aragón
> > > >
> > > > 1319291
> > > >
> > > > 0
> > > >
> > > > 05/03/2020
> > > >
> > > > Aragón
> > > >
> > > > 1319291
> > > >
> > > > 1
> > > >
> > > > 06/03/2020
> > > >
> > > > Aragón
> > > >
> > > > 1319291
> > > >
> > > > 6
> > > >
> > > > 04/03/2020
> > > >
> > > > Asturias
> > > >
> > > > 1022800
> > > >
> > > > 2
> > > >
> > > > 05/03/2020
> > > >
> > > > Asturias
> > > >
> > > > 1022800
> > > >
> > > > 5
> > > >
> > > > 06/03/2020
> > > >
> > > > Asturias
> > > >
> > > > 1022800
> > > >
> > > > 5
> > > >
> > > > Gracias
> > > >
> > > >   [[alternative HTML version deleted]]
> > > >
> > > > ___
> > > > R-help-es mailing list
> > > > R-help-es@r-project.org
> > > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > >
> > >  

Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema Carlos Ortega
Hola,

Te sale error porque has cargado el fichero con read.csv().
Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
El error que obtienes es porque el objeto df (igual que datos) no es un
data.table.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
javier.ruben.marcu...@gmail.com>) escribió:

> Eric
>
> ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> errores. Copio y pego todo como me sale en la consola.
>
> > #
>
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > datos <-
> read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> >
> > library(data.table)
> > library(ggplot2)
> > library(anytime)
> >
> > df <-datos
> >
> > df[, fec:=anytime(fec)]
> Error in `:=`(fec, anytime(fec)) :
>   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...) are
> defined for use in j, once only and in particular ways. See help(":=").
> > setkey(df,com,fec)
> Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
>   x is not a data.table
> >
> > # newc: son los nuevos casos
> > df[, newc:=ct - shift(ct), by=.(com)]
> Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by = .(com)) :
>   unused argument (by = .(com))
> >
> > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> >
> > df[, tasa:=newc/ct, by=.(com)]
> Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
>   unused argument (by = .(com))
>
> El dom., 22 mar. 2020 a las 16:52, neo ()
> escribió:
>
> > Hola Javier, yo lo hice de la siguiente forma:
> >
> > library(data.table)
> > library(ggplot2)
> > library(anytime)
> >
> > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > df[, fec:=anytime(fec)]
> > setkey(df,com,fec)
> >
> >  # newc: son los nuevos casos
> > df[, newc:=ct - shift(ct), by=.(com)]
> >
> >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> >
> > df[, tasa:=newc/ct, by=.(com)]
> >
> >
> > y obtuve lo siguiente:
> >
> >
> > fec   com pob ct newc tasa
> > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> > 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> > 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> > 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> > 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> > 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> > 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
> >
> > Espero que te sirva.
> >
> > Saludos !!
> >
> > Eric.
> >
> >
> >
> >
> > On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > > Hola:
> > >
> > > Tengo los datos diarios del número de casos de coronavirus por
> > comunidades
> > > autónomas y quiero calcular el número diario de nuevos casos y la tasa
> > > diaria de variación del número de casos y no se como hacerlo en R.
> > >
> > > *fecha*
> > >
> > > *comunidad*
> > >
> > > *poblacion*
> > >
> > > *casos_totales*
> > >
> > > 04/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 13
> > >
> > > 05/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 12
> > >
> > > 06/03/2020
> > >
> > > Andalucía
> > >
> > > 8414240
> > >
> > > 21
> > >
> > > 04/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 0
> > >
> > > 05/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 1
> > >
> > > 06/03/2020
> > >
> > > Aragón
> > >
> > > 1319291
> > >
> > > 6
> > >
> > > 04/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 2
> > >
> > > 05/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 5
> > >
> > > 06/03/2020
> > >
> > > Asturias
> > >
> > > 1022800
> > >
> > > 5
> > >
> > > Gracias
> > >
> > >   [[alternative HTML version deleted]]
> > >
> > > ___
> > > R-help-es mailing list
> > > R-help-es@r-project.org
> > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema Javier Marcuzzi
Eric

¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
errores. Copio y pego todo como me sale en la consola.

> #
https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> datos <-
read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
>
> library(data.table)
> library(ggplot2)
> library(anytime)
>
> df <-datos
>
> df[, fec:=anytime(fec)]
Error in `:=`(fec, anytime(fec)) :
  Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...) are
defined for use in j, once only and in particular ways. See help(":=").
> setkey(df,com,fec)
Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
  x is not a data.table
>
> # newc: son los nuevos casos
> df[, newc:=ct - shift(ct), by=.(com)]
Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by = .(com)) :
  unused argument (by = .(com))
>
> # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
>
> df[, tasa:=newc/ct, by=.(com)]
Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
  unused argument (by = .(com))

El dom., 22 mar. 2020 a las 16:52, neo ()
escribió:

> Hola Javier, yo lo hice de la siguiente forma:
>
> library(data.table)
> library(ggplot2)
> library(anytime)
>
> df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> df[, fec:=anytime(fec)]
> setkey(df,com,fec)
>
>  # newc: son los nuevos casos
> df[, newc:=ct - shift(ct), by=.(com)]
>
>  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
>
> df[, tasa:=newc/ct, by=.(com)]
>
>
> y obtuve lo siguiente:
>
>
> fec   com pob ct newc tasa
> 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
>
> Espero que te sirva.
>
> Saludos !!
>
> Eric.
>
>
>
>
> On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > Hola:
> >
> > Tengo los datos diarios del número de casos de coronavirus por
> comunidades
> > autónomas y quiero calcular el número diario de nuevos casos y la tasa
> > diaria de variación del número de casos y no se como hacerlo en R.
> >
> > *fecha*
> >
> > *comunidad*
> >
> > *poblacion*
> >
> > *casos_totales*
> >
> > 04/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 13
> >
> > 05/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 12
> >
> > 06/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 21
> >
> > 04/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 0
> >
> > 05/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 1
> >
> > 06/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 6
> >
> > 04/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 2
> >
> > 05/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 5
> >
> > 06/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 5
> >
> > Gracias
> >
> >   [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema Javier Marcuzzi
Eric

Gracias por compartir.

Javier Marcuzzi

El dom., 22 mar. 2020 a las 16:52, neo ()
escribió:

> Hola Javier, yo lo hice de la siguiente forma:
>
> library(data.table)
> library(ggplot2)
> library(anytime)
>
> df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> df[, fec:=anytime(fec)]
> setkey(df,com,fec)
>
>  # newc: son los nuevos casos
> df[, newc:=ct - shift(ct), by=.(com)]
>
>  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
>
> df[, tasa:=newc/ct, by=.(com)]
>
>
> y obtuve lo siguiente:
>
>
> fec   com pob ct newc tasa
> 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
>
> Espero que te sirva.
>
> Saludos !!
>
> Eric.
>
>
>
>
> On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > Hola:
> >
> > Tengo los datos diarios del número de casos de coronavirus por
> comunidades
> > autónomas y quiero calcular el número diario de nuevos casos y la tasa
> > diaria de variación del número de casos y no se como hacerlo en R.
> >
> > *fecha*
> >
> > *comunidad*
> >
> > *poblacion*
> >
> > *casos_totales*
> >
> > 04/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 13
> >
> > 05/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 12
> >
> > 06/03/2020
> >
> > Andalucía
> >
> > 8414240
> >
> > 21
> >
> > 04/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 0
> >
> > 05/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 1
> >
> > 06/03/2020
> >
> > Aragón
> >
> > 1319291
> >
> > 6
> >
> > 04/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 2
> >
> > 05/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 5
> >
> > 06/03/2020
> >
> > Asturias
> >
> > 1022800
> >
> > 5
> >
> > Gracias
> >
> >   [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tasa variación diaria COVID-19

2020-03-22 Por tema neo
Hola Javier, yo lo hice de la siguiente forma:

library(data.table)
library(ggplot2)
library(anytime)

df <- fread("/home/neo/Desktop/rhelp/spain.csv")
df[, fec:=anytime(fec)]
setkey(df,com,fec)

     # newc: son los nuevos casos
df[, newc:=ct - shift(ct), by=.(com)]

     # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1

df[, tasa:=newc/ct, by=.(com)]


y obtuve lo siguiente:


    fec   com pob ct newc tasa
1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
3: 2020-06-02 23:00:00 Andalucía 8414240 21    9 0.42857143
4: 2020-04-02 23:00:00    Aragón 1319291  0 NA  NA
5: 2020-05-02 23:00:00    Aragón 1319291  1    1 1.
6: 2020-06-02 23:00:00    Aragón 1319291  6    5 0.8333
7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
8: 2020-05-02 23:00:00  Asturias 1022800  5    3 0.6000
9: 2020-06-02 23:00:00  Asturias 1022800  5    0 0.

Espero que te sirva.

Saludos !!

Eric.




On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> Hola:
>
> Tengo los datos diarios del número de casos de coronavirus por comunidades
> autónomas y quiero calcular el número diario de nuevos casos y la tasa
> diaria de variación del número de casos y no se como hacerlo en R.
>
> *fecha*
>
> *comunidad*
>
> *poblacion*
>
> *casos_totales*
>
> 04/03/2020
>
> Andalucía
>
> 8414240
>
> 13
>
> 05/03/2020
>
> Andalucía
>
> 8414240
>
> 12
>
> 06/03/2020
>
> Andalucía
>
> 8414240
>
> 21
>
> 04/03/2020
>
> Aragón
>
> 1319291
>
> 0
>
> 05/03/2020
>
> Aragón
>
> 1319291
>
> 1
>
> 06/03/2020
>
> Aragón
>
> 1319291
>
> 6
>
> 04/03/2020
>
> Asturias
>
> 1022800
>
> 2
>
> 05/03/2020
>
> Asturias
>
> 1022800
>
> 5
>
> 06/03/2020
>
> Asturias
>
> 1022800
>
> 5
>
> Gracias
>
>   [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es