Steffen Grunewald schrieb: > Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist > nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der > DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem > Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung. > Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme > "Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen... > (was bei "äß" vermutlich spektakulär in die Hose geht). > Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche > Überraschungen dort noch warten.
Richtig, in der Datenbank ist Mischmasch zwischen ISO-8819-x und UTF-8. Beispiel ID 7: "Châteaugiron". Das â ist als 0xE2 in der DB, wäre als UTF-8 aber 0xC3 0xA2. Grüße, Michael
signature.asc
Description: OpenPGP digital signature
_______________________________________________ Talk-de mailing list [email protected] http://lists.openstreetmap.org/listinfo/talk-de

