On Wed, 21 Jan 2009 14:28:52 +0100, Andreas Labres <[email protected]> wrote: > Frederik Ramm wrote: >> 1. Wiki umstellen auf "es sollen Grossbuchstaben genutzt werden" >> 2. Inspector umstellen auf case-insensitive fuer die >> PLZ-Gebietsbestimmung >> 3. existierende kleingeschriebene addr:country mit Bot einmalig auf >> Grossbuchstaben abändern >> 4. alles, was im addr:country-Feld steht und nicht zwei Grossbuchstaben >> hat, künftig vom Inspector anmeckern lassen > > Gute Vorschläge, gefallen mir alle. :) > > IMO sollte man sich trotzdem eine bessere Alternative überlegen... jetzt > muß ich > schon überall Wien dazuschreiben, wo doch eigentlich eh kloa ist, daß PLZ > 1xxx > immer Wien ist. Aber daß ich jetzt tausendfach dazuschreiben muß, daß > Wien auch > wirklich in AT ist, is mühsam... beim place tag dazuschreiben oder sowas. > > Irgendwie schiene mir das überhaupt ein gangbarer Weg, sich die "optional" > Dinge > einer Adresse zusammenzusuchen... die Straße über die nächstliegende > Straße und > dann nach einem place tag in der Nähe suchen, dort könnten dann PLZ und > Ort zu > finden sein...
"in der Nähe Suchen" ist leider immer eine sehr teure Operation. Du suchst selten danach, ob Hausnummer 14 in der Testgasse jetzt in AT ist sondern eher, nach allen Hausnummern 14 in allen Strassen deren Name "Testgasse" enthält in AT und musst dafür für jede Hausnummer und jede solche Strasse "in der Nähe Suchen". Bzw. du machst das gleiche im Vorfeld für alle Strassen und alle Hausnummern der Welt um einen Such-Index zu bilden, den du beim nächsten hourly-diff aktualisieren musst und so jede Woche oder jeden Monat mal komplett von 0 neu bauen solltest. Wir sind leider noch nicht an dem Punkt wo man das Landesgrenzen-Polygon zuverlässig und vollständig für jedes Land abfragen kann und dann einfach zuerst mit der Bounding-Box des Landes, im Zweifel dann mit einem stark vereinfachten Polygon und im Zweifel dann mit dem ganzen Landesgrenzen-Polygon testen kann. Momentan stecken wir halt noch an dem Punkt fest, wo man mit viel Arbeit die geschätzten Bounding-Boxes von Orten und Bundesländern indizieren muss und dann hofft auf dem nächstgelegenen Ort das Bundesland oder das Land zu finden und dann auf dem Bundesland wenigstens das Land und in gut 20-30% der Fälle das Land oder die PLZ oder das Bundesland oder den Stadtteil mal eben garnicht mit einem >einfachen< und in sehr endlicher Zeit umsetzbaren Algorithmus ermitteln kann. Marcus _______________________________________________ Talk-de mailing list [email protected] http://lists.openstreetmap.org/listinfo/talk-de

