Até hoje, eu nunca havia testado as diferenças entre Latin1 e UTF8. Até mesmo na empresa onde trabalho, adotamos o padrão Latin1 para os bancos de dados do PostgreSQL. O UTF8 nunca foi utilizado porque em alguns fóruns li a informação de que "utilizar UTF8 degrada a performance e aumenta o tamanho do banco de dados consideravelmente".
Entretanto, tirei um tempo para pôr em prova estas informações que sempre passaram batido. Fiz um teste com um pequeno banco de dados repleto de campos VARCHAR e TEXT, criando um dump e restaurando-o em um banco criado com Latin1 e em outro com UTF8. Realmente o tamanho em disco do banco UTF 8 ficou maior. Entretanto, foram apenas alguns Kbytes a mais (26,7 Mb para o Latin1 contra 26,9 Mb para o UTF8). Entretanto fiquei em dúvida quanto a esta proporção de tamanho. Ainda não tirei um tempo para testar com uma base de dados maior - tenho apenas cópias de bancos de dados do PostgreSQL onde o arquivo de dump está em torno de 4 Gb. Logo gostaria de saber dos colegas se a utilização do encoding UTF8 traz algum problema de excesso no tamanho ou na apresentação/manipulação dos registros, pois nos testes que realizei não tive nenhum problema (usando UTF8 e a versão 7.10.01 do PostgreSQL ODBC for Windows). Mesmo assim, gostaria de uma segunda (terceira, quarta, quinta...) opinião. Se não existirem pormenores, considero o Latin1 obsoleto. -- Tiago J. Adami Dois Vizinhos - PR Brazil "Use linux, and set your soul free!"
_______________________________________________ pgbr-geral mailing list [email protected] https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
