On Sat 2012-03-10 (00:20), Michael Bemmerl wrote:
> Mitja Kleider schrieb:
> > On 03/09/2012 07:28 PM, Steffen Grunewald wrote:
> >> (wenn encode("utf-8") einen Fehler
> >> produziert, dann schlimmstenfalls den "near XYZ"-Teil ganz weglassen,
> >> hier in der Gegend produziert geonames teilweise ziemlich haarsträubende 
> >> Sachen).
> > 
> > Stimmt, der Ortsname ist nicht besonders präzise, sollte man mal durch
> > einen OSM Geocoder ersetzen ;)
> > 
> > Ich habe "near XYZ" auf dem Server rausgenommen, damit der Feed wieder
> > funktioniert. Vielleicht hast du ja Lust, [1] weiter voranzutreiben.
> 
> Ich hab' das mal auf meinem lokalen Rechner ausprobiert, und konnte den
> Fehler bei mir lösen, indem ich den MySQL-Client auf UTF-8 konfiguriert
> habe. Bei mir ist (auch?) noch die Standard-Zeichenkodierung von Mysql
> auf latin1 eingestellt. Auch das encode("utf-8") brauchte es nicht mehr.
> 
> Ich hab' die Änderung mal in meinen Fork eingecheckt [1].

Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist
nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der 
DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem
Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung.
Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme 
"Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen...
(was bei "äß" vermutlich spektakulär in die Hose geht).
Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche 
Überraschungen dort noch warten.

Anstelle des "near $name" könnte ich mir (etwa auf volle Bogenminuten 
gerundete) Positionen vorstellen, ich sehe zwar die Koordinaten im Link,
aber nur in Dezimalgrad...

S

_______________________________________________
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an