Muchas gracias Isidro, problema solucionado con la función grep(). Este documento me ha sido de mucha utilidad:* Introduction to String Matching and Modification in R Using **Regular Expressions*
http://biostat.mc.vanderbilt.edu/wiki/pub/Main/SvetlanaEdenRFiles/regExprTalk.pdf El 3 de febrero de 2017, 9:05, Isidro Hidalgo Arellano <[email protected]> escribió: > Hola: > Asegúrate de que la información que tienes es correcta, porque da la > impresión de que existe un problema de "calidad" en esas variables. > Mira la ayuda de la función "grep()". > Puedes cargar la variable como "character", excluir con grep() todo lo que > no sea número y después convertir a número con "as.numeric()". > Un saludo > > Isidro Hidalgo Arellano > Observatorio del Mercado de Trabajo > Consejería de Economía, Empresas y Empleo > http://www.castillalamancha.es/ > > > -----Mensaje original----- > De: R-help-es [mailto:[email protected]] En nombre de > [email protected] > Enviado el: viernes, 03 de febrero de 2017 3:45 > Para: Javier Gómez Gonzalez <[email protected]>; [email protected] > Asunto: Re: [R-es] Limpiar variables > > Estimado Javier Gómez Gonzalez > > Hay una diferencia entre lo que tiene y lo que piensa que tiene, si usted > escribe lo siguiente: > > str(el data frame con los datos) > > R le informa lo que tiene, en su ejemplo A% seguro que no es informado como > numérico. > > Ahora hay otro problema, si por ejemplo la variable es altura de las > personas, ¿Quién mide A%? > > Los datos tienen errores, una alternativa es usar expresiones regulares, > con > estas se aceptan números, lógicamente lo que no le es se descarta o borra > de > los datos. Pero usted dice que carga los archivos desde un csv ¿Qué > posibilidades hay de preparar los datos de una forma más limpia para que R > importe solo números en las variables numéricas? > > Javier Rubén Marcuzzi > > De: Javier Gómez Gonzalez > Enviado: jueves, 2 de febrero de 2017 22:40 > Para: [email protected] > Asunto: [R-es] Limpiar variables > > Hola: > > Tengo una serie de variables numéricas en las que aparecen caracteres > extraños. Las variables tienen unos 50000 datos aproximadamente. > ejemplo: > > {1,25,47,A%.....,25N,....C,.....) > > No es un problema a la hora de cargar el archivo csv a R. Estos caracteres > ya vienen en el csv. > ¿Cómo podría limpiarlos en R? > > Muchas gracias > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
