Por error se lo envi� solo a Carlos..., lo env�o de nuevo...

-------- Mensaje reenviado --------
Asunto:         Re: [R-es] Trabajar en un �nico formato de codificaci�n
Fecha:  Mon, 09 Feb 2015 10:39:36 +0100
De:     rubenfcasal <[email protected]>
Para:   Carlos J. Gil Bellosta <[email protected]>



Hola a todos,

     Yo tambi�n tuve algunos problemas con la codificaci�n de
caracteres. Mi recomendaci�n es la misma que la de Carlos, emplear
siempre UTF-8.
     Con esto evitas problemas al trabajar con texto, p.e. podr�as
emplear comandos de la forma (reutilizando un c�digo que emple�...):

write.table(datos, "datos.csv", sep=";", col.names=TRUE, row.names=FALSE,
   quote=TRUE, na="NA", fileEncoding = "UTF-8")

datos <- read.table("datos.csv", header=TRUE, sep=";", na.strings="NA",
dec=".",
   strip.white=TRUE, encoding = "UTF-8")

     A�n as� puede haber problemas con los objetos, sobre todo al
guardarlos en formato .RData. Intentando enterarme de lo que pasa,
encontr� que R almacena el tipo de codificaci�n con cada cadena, pero
por defecto lo almacena como "unknown" (que entiendo que considera el
local de la maquina, las otras altarnativas son "latin1", "UTF-8" y
"bytes").  Se puede ver la codificaci�n de cualquier vector de texto con
Encoding() y cambiarla. Para pasar a "UTF-8" tambi�n se puede usar
enc2utf8().

     Suponiendo que creas el objeto datos con el comando anterior, si lo
guardas en un .Rdata a�n puedes tener problemas al abrirlo en otro S.O.
(por lo menos a m� me pas�). Por ejemplo con los nombres de las
variables o los niveles de los factores (si hay caracteres especiales
como acentos). En ese caso yo lo solucion� empleando enc2utf8() antes de
llamar a save(). E.g.:
names(datos) <- enc2utf8(names(datos)).

     Supongo que puede ser m�s c�modo cambiar la configuraci�n de R
(?Sys.setlocale), pero yo no lo prob�...

     Un saludo, Rub�n.




El 06/02/2015 a las 16:42, Carlos J. Gil Bellosta escribi�:
> Hola, �qu� tal?
>
> Mi consejo: usad UTF-8 a rajatabla. En c�digo, en ficheros de texto,
> etc. En Mac y la mayor parte de los Linux normales no hay que hacer
> nada en particular. En Windows: hay que hacer expl�cito que los datos
> que lees son UTF-8 (mira las opciones Encoding y fileEnconding de las
> funciones de lectura).
>
> Tambi�n pod�ais tratar de utilizar JSON (que obliga a usar UTF-8) en
> lugar de CSV para el intercambio de datos.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
>
> El d�a 6 de febrero de 2015, 16:36, Javier Villacampa Gonz�lez
> <[email protected]> escribi�:
>> Hola buenas,
>>
>> quer�a preguntaros si alguno me podr�a ayudar con lo siguiente.
>>
>> Estoy ayudando a unos colegas de jap�n con un estudio de palabras. Y nos
>> ocurre lo siguiente.
>> Yo hago los scripts y guardo los RDatao csv, pero estamos teniendo
>> problemas de compatibilidad entre sistemas.
>>
>> Me gustar�a que se pudiese guardar todos ficheros de R en el mismo formato
>> de codificaci�n de datos. Los ficheros R, los ficheros csv y sobretodo los
>> RData y as� evitar problemas de codificaci�n.
>>
>> Muchas gracias por adelantado
>> #-------------------------------------------------------------------------
>> PD: Momento frustraci�n...
>>
>> 1)Ya que si yo leo el fichero csv como UTF-16 pero luego guarda el csv como
>> otra cosa es un peque�o infierno para hacer los scripts compatibles.
>>
>> 2)Porque si leo el csv en mac y me guarda los RData en una codificaci�n,
>> luego en windows lo hace de otra... al final no hay maldita manera de
>> pasarles un modelo. Malditamente frustrante...
>>
>>
>> --
>>
>>          [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> [email protected]
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
> _______________________________________________
> R-help-es mailing list
> [email protected]
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>




        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a