Re: [R-es] HELP!! Expansión de variables en una base de datos con ID duplicados

2021-02-28 Por tema Carlos Ortega
Hola,

Otra alternativa es la siguiente usando data.table.
En el ejemplo genero/incluyo un pequeño dataset para reproducir el caso...

#--
library(data.table)
set.seed(10)
DT <- data.table(
  Id= sample(1:10, 100, replace = TRUE),
  Nro_visita= sample(1:10, 100, replace = TRUE),
  X = rnorm(100),
  Y = rnorm(100),
  Z = rnorm(100)
)

#--- Convertir tu data.frame a data.table
# DT <- as.data.frame(tu_df)

#--- Ordeno el data.table por ID y por nro_visita en orden decreciente.
setorder(DT, Id, -Nro_visita)
#--- Me quedo solo con el primer elemento de cada Id. Que es la última
visita
res_dt <- DT[ , .SD[1], by = Id]
res_dt

#

Gracias,
Carlos Ortega
www.qualityexcellence.es

El dom, 28 feb 2021 a las 15:38, kendy Boisrond ()
escribió:

> Hola Comunidad,
>
> Por favor necesito su ayuda:
>
> Se trata de una base, donde cada "ID" representa una vivienda única, pero
> por lo que puede haber más visitas en una misma vivienda, los "ID" están
> duplicados.
> La base visitas es de dimensión: 98692 x 52 (ID duplicados)
> y la base vivienda tendría una dimensión 29866 x 52 (ID únicos).
>
> A partir de la base "visitas", necesito sacar todos los "ID" únicos de la
> última visita en cada vivienda, y pude hacerlo con ese comando:
>
> Base1<- subset(Base_Visitas %>% group_by(enc_idr) %>% summarise(NRO_VISITA
> = max(NRO_VISITA)))
> dim(Base1)
>
> [1] 29866 2
>
> Sin embargo, necesito que me lo expande para todas las 52 variables para
> así realizar otro análisis... Llegué hasta aquí. ¿Me pueden ayudar a
> expandirla para todas las variables, por favor?
> Muchas gracias!!
>
>
>
> --
> *Kendy B.*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] HELP!! Expansión de variables en una base de datos con ID duplicados

2021-02-28 Por tema Carlos J. Gil Bellosta
Hola, ¿qué tal?

En seudocódigo:

   - Aplicas rank sobre -NRO_VISITA por ID (usando group_by + mutate).
   - Te quedas con el rank == 1.

Un saludo,

Carlos J. Gil Bellosta
http://www

El dom, 28 feb 2021 a las 15:38, kendy Boisrond ()
escribió:

> Hola Comunidad,
>
> Por favor necesito su ayuda:
>
> Se trata de una base, donde cada "ID" representa una vivienda única, pero
> por lo que puede haber más visitas en una misma vivienda, los "ID" están
> duplicados.
> La base visitas es de dimensión: 98692 x 52 (ID duplicados)
> y la base vivienda tendría una dimensión 29866 x 52 (ID únicos).
>
> A partir de la base "visitas", necesito sacar todos los "ID" únicos de la
> última visita en cada vivienda, y pude hacerlo con ese comando:
>
> Base1<- subset(Base_Visitas %>% group_by(enc_idr) %>% summarise(NRO_VISITA
> = max(NRO_VISITA)))
> dim(Base1)
>
> [1] 29866 2
>
> Sin embargo, necesito que me lo expande para todas las 52 variables para
> así realizar otro análisis... Llegué hasta aquí. ¿Me pueden ayudar a
> expandirla para todas las variables, por favor?
> Muchas gracias!!
>
>
>
> --
> *Kendy B.*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] HELP!! Expansión de variables en una base de datos con ID duplicados

2021-02-28 Por tema kendy Boisrond
Hola Comunidad,

Por favor necesito su ayuda:

Se trata de una base, donde cada "ID" representa una vivienda única, pero
por lo que puede haber más visitas en una misma vivienda, los "ID" están
duplicados.
La base visitas es de dimensión: 98692 x 52 (ID duplicados)
y la base vivienda tendría una dimensión 29866 x 52 (ID únicos).

A partir de la base "visitas", necesito sacar todos los "ID" únicos de la
última visita en cada vivienda, y pude hacerlo con ese comando:

Base1<- subset(Base_Visitas %>% group_by(enc_idr) %>% summarise(NRO_VISITA
= max(NRO_VISITA)))
dim(Base1)

[1] 29866 2

Sin embargo, necesito que me lo expande para todas las 52 variables para
así realizar otro análisis... Llegué hasta aquí. ¿Me pueden ayudar a
expandirla para todas las variables, por favor?
Muchas gracias!!



-- 
*Kendy B.*

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es