2007/6/5, Euler Taveira de Oliveira <[EMAIL PROTECTED]>:

É o procedimento que sempre uso. Mas como assim não conseguiu converter
alguns caracteres? Você detectou quais eram eles? O hexdump pode te
ajudar aqui.


$ grep -e "R.ga" ora-dicts/french-english-2007-05-26.csv
Rīga;Riga;FR

$ echo "Rīga;Riga;FR" | iconv -f utf-8 -t iso-8859-1
Riconv: sequência de entrada ilegal na posição 1

$ grep -e "R.ga" ora-dicts/french-english-2007-05-26.csv | iconv -f utf-8 -t
iso-8859-1
Riconv: sequência de entrada ilegal na posição 1

$ echo "Rīga;Riga;FR" | hd -b
00000000  52 c4 ab 67 61 3b 52 69  67 61 3b 46 52 0a        |Rīga;Riga;FR.|
0000000 122 304 253 147 141 073 122 151 147 141 073 106 122 012
000000e

$ echo -e "\304\253" | iconv -f utf-8 -t iso-8859-1
iconv: sequência de entrada ilegal na posição 0

Outra coisa, você tem certeza que o conjunto de caracteres (charset) de
origem era UTF-8 [1]?


$ file ora-dicts/french-english-2007-05-26.csv
ora-dicts/french-english-2007-05-26.csv: UTF-8 Unicode English text, with
CRLF line terminators


Acho que o tal mapeamento não existe porque o ASCII é um subconjunto do
UTF (aka UCS).


Mas é justamente isso que eu quero: reduzir um conjunto de caracteres a um
subconjunto menor, i.e: substituir caracteres especiais por equivalentes sem
acentuação.

Abraço,

--
Rodrigo Hjort
http://icewall.org/~hjort
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a