Steffen Grunewald schrieb:
> Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist
> nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der 
> DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem
> Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung.
> Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme 
> "Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen...
> (was bei "äß" vermutlich spektakulär in die Hose geht).
> Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche 
> Überraschungen dort noch warten.

Richtig, in der Datenbank ist Mischmasch zwischen ISO-8819-x und UTF-8.
Beispiel ID 7: "Châteaugiron". Das â ist als 0xE2 in der DB, wäre als
UTF-8 aber 0xC3 0xA2.

Grüße,
Michael

Attachment: signature.asc
Description: OpenPGP digital signature

_______________________________________________
Talk-de mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an