2006/1/19, Gilberto F da Silva <[EMAIL PROTECTED]>:
>
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
>
> Andre Cavalcante wrote:
> > Lembrando ao pessoal que falou que o txt sobrevive a tudo:
> > Só mais uma questão sobre versões antigas: arquivos .txt atuais são
> Unicode
> > (16 bits) e,
>
>         Até existe unicode de 16 bits mas o que é implementado nos
> computadores é o
> UTF-8 que utiliza somente 8 bits.


Bom, meu Linux implementa ISO-8859-2 e ISO-8859-15. Já trabalha com Unicode
desde os tempos do Kernel 2.4. O Windows implementa ISO-8859-1 e ISO-8859-2
desde a versão 2000. Isso aqui no Brasil. Em outros lugares há outras
tabelas e páginas de código suportáveis.
UTF-8 é um "gambiarra" para que os softwares atuais sejam meio compatíveis
com o txt antigo (ASCII puro tem 7 bits e não 8). Visualmente os software
deram um jeito para mostrar o texto de maneira idêntica, mas os binários não
são iguais. Quem já trabalhou com terminais em sistemas antigos (p.ex. um
central telefônica das décadas de 80/90) sabe que mesmo terminais modernos
tem dificuldade com alguns tipos de emulação bem antigos (e olha que é tudo
"texto").

André Cavalcante
Manaus, AM.

Responder a