jj, to bude asi ten problem, ze se v connct stringu nic
nespecifikovalo a tudis nevim, jake kodovani driver predpokladal a
jestli byl schopen od serveru zjistit, v jakem kodovani je DB.
Jednalo se o MS SQL server s kodovanim win-1250 a JDBC driver od
Microsoftu.
Takze jeste pohledam timto smerem a ted uz by se melo podarit
premluvit ho na UTF-8 ;-)
Jeste jednou dekuji za uzitecne rady.
PavelR
Martin Kuba wrote:
Pavel Rezny wrote:
Pro pristup do DB pouzivame Hibernate a pokud byla DB win-1250 a
stranka byla win-1250 bylo vse spravne, ale pokud byla stranka v
html-head-meta oznacena jako UTF-8 nebylo kodovani spravne, i kdyz v
Tapestry 3 (http://jakarta.apache.org/tapestry/) bylo vse nastaveno
na UTF-8 (jeste nebylo pouzivano JSF).
To vypada, ze data z databaze byla nactena sice jako windows-1250
bajty, ale s deklaraci iso-8859-1, takze ve vnitrnim ulozeni javy
to byl nejaky nesmysl. Nicmene kdyz se na vystup daly jako iso-8859-1
(default kodovani ze servletu) a v HTML META tagu se to oznacilo
jako windows-1250, provedl browser druhy spatny preklad, ktery ale
vyrusil tu prvni chybu, takze se to zobrazilo dobre.
Naopak spravne nastaveni kodovani na utf-8 situaci opticky zhorsilo.
Takze problem bude v nastaveni databaze. Co pouzivate ?
Vidim to tak, ze JDBC driver je natolik hloupy, ze se nezepta
serveru na spravne kodovani, a zaroven mu nebylo spravne kodovani
rucne nastaveno. To dela treba MySQL, ale nejspis i jine databaze.
Takze jeste proverim, jak jsou opravdu predavana data z Hibernate a
jestli by tedy bylo mozne nastavit kodovou stranku vzdy na UTF-8 bez
ohledu na to, jak jsou ulozena data v DB.
Ano vnitrni reprezentaci Stringu v Jave chapu presne tak, jak jste
popsal vyse, a samozrejme pokud se pouziji nastroje javy pro nacitani
z DB/souboru, tak se vzdy uvadi v jakem kodovani je zdroj. Ale
protoze jsem si nebyl vubec jisty, jak data dostavam z DB a mel jsem
predchozi spatnou zkusenost, tak jsem nechtel omezit stranky pouze na
UTF-8. Ale pokud to nebude pusobit zadny problem, budu jedine rad,
kdyz budou stranky vzdy v UTF-8.
Spravne nacteni dat z databaze je odpovednosti JDBC driveru,
musite se podivat do jeho dokumentace. Kdyz bude nejhur,
muzete spatne nacteny String opravit takhle:
String dobre = new String(spatne.getBytes("spatne kodovani"),"spravne
kodovani");
ale treba u MySQL staci do JDBC URL dat
?useUnicode=true&characterEncoding=windows-1250
samozrejme za predpokladu, ze server pouziva windows-1250,
a pak vsechno funguje jako po masle.
Makub