Por error se lo envi� solo a Carlos..., lo env�o de nuevo...
-------- Mensaje reenviado -------- Asunto: Re: [R-es] Trabajar en un �nico formato de codificaci�n Fecha: Mon, 09 Feb 2015 10:39:36 +0100 De: rubenfcasal <[email protected]> Para: Carlos J. Gil Bellosta <[email protected]> Hola a todos, Yo tambi�n tuve algunos problemas con la codificaci�n de caracteres. Mi recomendaci�n es la misma que la de Carlos, emplear siempre UTF-8. Con esto evitas problemas al trabajar con texto, p.e. podr�as emplear comandos de la forma (reutilizando un c�digo que emple�...): write.table(datos, "datos.csv", sep=";", col.names=TRUE, row.names=FALSE, quote=TRUE, na="NA", fileEncoding = "UTF-8") datos <- read.table("datos.csv", header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE, encoding = "UTF-8") A�n as� puede haber problemas con los objetos, sobre todo al guardarlos en formato .RData. Intentando enterarme de lo que pasa, encontr� que R almacena el tipo de codificaci�n con cada cadena, pero por defecto lo almacena como "unknown" (que entiendo que considera el local de la maquina, las otras altarnativas son "latin1", "UTF-8" y "bytes"). Se puede ver la codificaci�n de cualquier vector de texto con Encoding() y cambiarla. Para pasar a "UTF-8" tambi�n se puede usar enc2utf8(). Suponiendo que creas el objeto datos con el comando anterior, si lo guardas en un .Rdata a�n puedes tener problemas al abrirlo en otro S.O. (por lo menos a m� me pas�). Por ejemplo con los nombres de las variables o los niveles de los factores (si hay caracteres especiales como acentos). En ese caso yo lo solucion� empleando enc2utf8() antes de llamar a save(). E.g.: names(datos) <- enc2utf8(names(datos)). Supongo que puede ser m�s c�modo cambiar la configuraci�n de R (?Sys.setlocale), pero yo no lo prob�... Un saludo, Rub�n. El 06/02/2015 a las 16:42, Carlos J. Gil Bellosta escribi�: > Hola, �qu� tal? > > Mi consejo: usad UTF-8 a rajatabla. En c�digo, en ficheros de texto, > etc. En Mac y la mayor parte de los Linux normales no hay que hacer > nada en particular. En Windows: hay que hacer expl�cito que los datos > que lees son UTF-8 (mira las opciones Encoding y fileEnconding de las > funciones de lectura). > > Tambi�n pod�ais tratar de utilizar JSON (que obliga a usar UTF-8) en > lugar de CSV para el intercambio de datos. > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com > > > > > El d�a 6 de febrero de 2015, 16:36, Javier Villacampa Gonz�lez > <[email protected]> escribi�: >> Hola buenas, >> >> quer�a preguntaros si alguno me podr�a ayudar con lo siguiente. >> >> Estoy ayudando a unos colegas de jap�n con un estudio de palabras. Y nos >> ocurre lo siguiente. >> Yo hago los scripts y guardo los RDatao csv, pero estamos teniendo >> problemas de compatibilidad entre sistemas. >> >> Me gustar�a que se pudiese guardar todos ficheros de R en el mismo formato >> de codificaci�n de datos. Los ficheros R, los ficheros csv y sobretodo los >> RData y as� evitar problemas de codificaci�n. >> >> Muchas gracias por adelantado >> #------------------------------------------------------------------------- >> PD: Momento frustraci�n... >> >> 1)Ya que si yo leo el fichero csv como UTF-16 pero luego guarda el csv como >> otra cosa es un peque�o infierno para hacer los scripts compatibles. >> >> 2)Porque si leo el csv en mac y me guarda los RData en una codificaci�n, >> luego en windows lo hace de otra... al final no hay maldita manera de >> pasarles un modelo. Malditamente frustrante... >> >> >> -- >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> [email protected] >> https://stat.ethz.ch/mailman/listinfo/r-help-es > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
