[R-es] Muestreo de bases de datos.-

Freddy Omar López Quintero Mon, 04 May 2015 11:25:02 -0700

¡Hola!

Mi duda surge por la siguiente anécdota: un amigo (empleado de una enorme
consultora que tiene SAS) migró a R y ansioso me contó que iba a ejecutar
las rutinas que había traducido de SAS a R y luego de intentar ejecutarlas
nada le funcionó porque, ingenuamente, quería hacer cosas para las cuales R
no está diseñado (operaciones en la base de datos) y porque leyó TODOS los
datos de una consulta (millones de registros) e intentó correr algún
procedimiento (!). Me dijo que SAS corre todo lo que él necesita y pues
quedó tristemente decepcionado.


Yo le dije que es corriente tomar una muestra de los datos para calibrar
los modelos que se van a necesitar y que no es necesario utilizar los
millones de registros enteros. Esto me hizo pensar ¿existen normas o buenas
prácticas para el muestreo de las bases de datos?¿existen
normativas?¿lineamientos? Es claro que mi primera respuesta sería ocupar
los métodos ya desarrollados para encuestas, pero quién sabe.

Si existen: ¿tienen su contraparte en R?

Gracias y disculpen las molestias.

¡Salud!

-- 
«No soy aquellas sombras tutelares
que honré con versos que no olvida el tiempo.»

JL Borges

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] Muestreo de bases de datos.-

Responder a