Estimado Mauricio Monsalvo
¿Puede usar esos datos importados a una base de datos? Por ejemplo en mysql un
código como puede ser:
SELECT email, COUNT(*) Total
FROM clientes
GROUP BY email
HAVING COUNT(*) > 1
Para buscar los duplicados (en este caso correos electrónicos), la idea es
conocer las variables y cantidades, una vez que las conoce puede actualizar
para ir normalizando los datos (desde el punto de vista de la base de datos).
Luego solo tendría un problema, conocer los decimales, pero eso ya fue resuelto
anteriormente por la base de datos al importar los datos, o fueron importados
como cadena (varchar, etc.). En ese caso tendría unas nuevas columnas que
llenaría con consultas.
Cuándo pueda tener los datos bien almacenados, recién piense en importarlos a
R, datos mal almacenados son casi imposible de recuperar en R.
Por desgracia datos mal almacenados es algo común, ¿puede ingresar al
almacenamiento a un nivel más adecuado?, me refiero a algo más próximo a los
originales para poder usted mismo acomodarlos para luego exportarlos a R.
Otra forma pero que requiere conocimientos de programación, es leer el archivo
desde un lenguaje de programación, C#, Java, C++, F, y acomodar desde alguno de
estos, pero para eso también debería conocer muy bien como acomodar los datos,
sería muy sencillo cometer un error lógico (hay resultados procesados
correctamente, pero obteniendo valores inadecuados, por el error de lógica).
Javier Rubén Marcuzzi
De: Mauricio Monsalvo
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es