Re: [R-es] Optimización identificación de casos similares

2019-02-07 Por tema Javier Marcuzzi
Estimados Si es por la cantidad de memoria, tal como indica Carlos Ortega, yo no tengo experiencia ni conocimientos para el área referida en el hilo del correo, pero sí me tocó tener que trabajar tratando de reducir la cantidad de memoria al utilizar matrices, copio y pego un ejemplo por si es de

Re: [R-es] Optimización identificación de casos similares

2019-02-07 Por tema Eric
No he mirado el codigo ni los datos, pero en estos asuntos de comparación la teoría dice que se ahorra tiempo si antes de comparar ordenas la columna de mayor a menor por ejemplo en ese caso, más allá de cierta distancia no vale la pena seguir comparando porque los números ya serán todos

Re: [R-es] BUCLE REGRESION

2019-02-07 Por tema Carlos Ortega
Hola, Muy probablemente encontrarás más ayuda en la lista si en vez de plantear tu duda como si nos dieras una asignación, mostraras un poco más de "netetiquette". Dijeras cuál es tu problema, qué has podido plantear y si ya has hecho algo, qué problema estás teniendo, adjuntaras datos de

Re: [R-es] Optimización identificación de casos similares

2019-02-07 Por tema Carlos Ortega
Hola, Puedes hacerlo de otras formas sin que tengas que calcular una matriz de distancias. Calcular la matriz de distancias de todos con todos, te lleva a tener una matriz de 1e5 x 1e5 de enteros (en el mejor de los casos) y esos son ya varias decenas de gigas. Una alternativa es esta: -

[R-es] BUCLE REGRESION

2019-02-07 Por tema Jhon Vidal Figueroa Céspedes
Implementar una rutina en R que permita estimar un modelo de regresión lineal omitiendo un registro. Use el archivo de datos Datos_Trabajo_R.xlsx. Observación: si el archivo contiene n registros, entonces se estimarán n regresiones con (n-1) registros cada una. El programa deberá mostrar un

Re: [R-es] Optimización identificación de casos similares

2019-02-07 Por tema Javier Marcuzzi
Estimado David Contreras Puedes compilar el código, mire lo siguiente http://homepage.divms.uiowa.edu/~luke/R/compiler/compiler.pdf Javier Ruben Marcuzzi El jue., 7 feb. 2019 a las 13:24, David Contreras (< davidcontrera...@gmail.com>) escribió: > Buen día a todos, > > Agradezco su ayuda con

Re: [R-es] Optimización identificación de casos similares

2019-02-07 Por tema David Contreras
Gracias Jesús por tu ayuda. El tema es que como está el código si se identifican, pero el problema es que tiene que validar cada caso con los otros 99.999 casos y ahí la máquina no soporta el proceso. *David Contreras* Estadístico Móvil 3124345188.

[R-es] Optimización identificación de casos similares

2019-02-07 Por tema David Contreras
Buen día a todos, Agradezco su ayuda con lo siguiente: Tengo 100.000 registros con nombres de personas con su respectivo número de documento, quiero identificar casos que tengan un porcentaje de igualdad alto, no del 100% porque ya esos los tengo identificados, sino casos como por ejemplo:

Re: [R-es] Paquete de R que use la sintaxis de SQL

2019-02-07 Por tema Javier Marcuzzi
Estimado Fernando Sql Server 2017 permite dentro de SQL usar R. Tiene las dos posibilidades, desde R SQL y desde SQL R. Javier Rubén Marcuzzi El jue., 7 feb. 2019 a las 5:02, Jorge Pradas () escribió: > Hola, > > ¿la fuente de datos será igualmente Sql Server? si es así puedes > usar sqlQuery

Re: [R-es] Paquete de R que use la sintaxis de SQL

2019-02-07 Por tema Jorge Pradas
Hola, ¿la fuente de datos será igualmente Sql Server? si es así puedes usar sqlQuery y RODBC por ejemplo que usa sintaxis sql y mantener las mismas sentencias. Habría que probar pero supongo que aceptará todo tipo de sentencias sql como las que comentas. UPDATE seguro. Jorge El jue., 7 feb.