Até hoje, eu nunca havia testado as diferenças entre Latin1 e UTF8. Até
mesmo na empresa onde trabalho, adotamos o padrão Latin1 para os bancos de
dados do PostgreSQL. O UTF8 nunca foi utilizado porque em alguns fóruns li a
informação de que "utilizar UTF8 degrada a performance e aumenta o tamanho
do banco de dados consideravelmente".

Entretanto, tirei um tempo para pôr em prova estas informações que sempre
passaram batido. Fiz um teste com um pequeno banco de dados repleto de
campos VARCHAR e TEXT, criando um dump e restaurando-o em um banco criado
com Latin1 e em outro com UTF8.

Realmente o tamanho em disco do banco UTF 8 ficou maior. Entretanto, foram
apenas alguns Kbytes a mais (26,7 Mb para o Latin1 contra 26,9 Mb para o
UTF8).

Entretanto fiquei em dúvida quanto a esta proporção de tamanho. Ainda não
tirei um tempo para testar com uma base de dados maior - tenho apenas cópias
de bancos de dados do PostgreSQL onde o arquivo de dump está em torno de 4
Gb.

Logo gostaria de saber dos colegas se a utilização do encoding UTF8 traz
algum problema de excesso no tamanho ou na apresentação/manipulação dos
registros, pois nos testes que realizei não tive nenhum problema (usando
UTF8 e a versão 7.10.01 do  PostgreSQL ODBC for Windows). Mesmo assim,
gostaria de uma segunda (terceira, quarta, quinta...) opinião.

Se não existirem pormenores, considero o Latin1 obsoleto.


--
Tiago J. Adami

Dois Vizinhos - PR
Brazil

"Use linux, and set your soul free!"
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a