Re: [R-es] cantidad de datos

2015-04-29 Por tema javier.ruben.marcuzzi
978194441 RPM *157793 *r...@cajatrujillo.com.pe www.cajatrujillo.com.pe De: Carlos Ortega [mailto:c...@qualityexcellence.es] Enviado el: miércoles, 29 de abril de 2015 10:39 AM Para: Alva Valiente, Ricardo (RIAV) CC: r-help-es@r-project.org Asunto: Re: [R-es] cantidad de datos Hola, La

Re: [R-es] cantidad de datos

2015-04-29 Por tema Carlos Ortega
Hola, La matriz que vas a procesar será de alrededor de 45 Mb. No creo que tengas problemas para cargar este conjunto de datos a tu entorno. El problema puede aparecer en generar el objeto clúster y esto dependerá de la RAM que tengas disponible. Pásanos el detalle de la máquina que utilizarías

Re: [R-es] cantidad de datos

2015-04-29 Por tema Jose Luis Cañadas Reche
...@cajatrujillo.com.pe www.cajatrujillo.com.pe De: Carlos Ortega [mailto:c...@qualityexcellence.es] Enviado el: miércoles, 29 de abril de 2015 10:39 AM Para: Alva Valiente, Ricardo (RIAV) CC: r-help-es@r-project.org Asunto: Re: [R-es] cantidad de datos Hola, La matriz que vas a procesar será de

Re: [R-es] cantidad de datos

2015-04-29 Por tema Jose Luis Cañadas Reche
-help-es@r-project.org Asunto: Re: [R-es] cantidad de datos Estimados Justo se me ocurrió una búsqueda y el resultado es parecido. http://www.r-bloggers.com/k-means-clustering-on-big-data/ Javier Marcuzzi De: jose luis cañadas Enviado el: ‎miércoles‎, ‎29‎ de ‎abril‎ de ‎2015 ‎02‎:‎10‎

Re: [R-es] cantidad de datos

2015-04-29 Por tema Alva Valiente, Ricardo (RIAV)
-project.org] En nombre de javier.ruben.marcu...@gmail.com Enviado el: miércoles, 29 de abril de 2015 12:16 PM Para: jose luis cañadas; R-help-es@r-project.org Asunto: Re: [R-es] cantidad de datos Estimados Justo se me ocurrió una búsqueda y el resultado es parecido. http://www.r-bloggers.com/k

Re: [R-es] cantidad de datos

2015-04-29 Por tema Carlos Ortega
Asunto: Re: [R-es] cantidad de datos Podrías hacer varios kmedias con diferente número de clusters y comprobar como varía la suma de cuadrados entre cluster para elegir el número óptimo. # Determine number of clusters wss - (nrow(mydata)-1)*sum(apply(mydata,2,var)) for (i in 2:15) wss[i

[R-es] cantidad de datos

2015-04-29 Por tema Alva Valiente, Ricardo (RIAV)
Estimados dos consultas. -Debo de trabajar con 280,000.00 casos y 20 variables. Quisiera saber si el programa soporta sin ningún inconveniente análisis cluster y discriminantes, así como análisis uni variados y bi variados. -Cuando se grafica un dendograma como puedo hacer para que todas las