Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht
On Wed, 28 Oct 2009 10:09:07 +0100, Jochen Topf joc...@remote.org wrote: Ich hab das mit Voronoi mal gemacht. Für die Statistik-Sprache R gibts da Code. Und für PostGIS gibts ein R-Plugin. Anleitung dazu gibts irgendwo im Web. Grundsätzlich kommen, wenn zumindest ein paar Punkte mit PLZ vorhanden sind, garnicht so schlechte Ergebnisse raus. Aber das ganze ist ziemlich langsam. Eine einzelne Stadt bekommt man noch hin, aber für ganz Deutschland würde es wohl Tage lang rechnen. Vielleicht kann man vorher die Punktmenge irgendwie ausdünnen oder so. War das langsamer das Errechnen und speichern eines Voronoi-Diagramms oder die Abfrage eines nearest neighbor? Marcus ___ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de
[Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht
Hallo Leute, ich suche gerade eine geeignete Möglichkeit um eine Lat+Lon - PLZ Abbildung zu machen. Momentan denke ich darüber nach disjunkte, konvexe Hüllen über alle Elemente welche innerhalb eines Staates den gleichen Wert in addr:postcode bzw postal_code haben zu bilden. Dann könnte man über diese Polygone eine sehr, sehr grosse Anzahl an Positionen ihren PLZ-Werten zuordnen. Meine erste Idee wäre: für alle (Punkte p welche eine PLZ haben oder Teil eines Weges/Gebietes mit einer PLZ sind) tue: { Suche das Polygon P zu dieser PLZ+Staat -Kombination. Falls P nicht existiert, { lege P mit diesem eine Punkt an. } Falls P existiert und p nicht in P enthalten ist: { Füge p dem Polygon P hinzu und entferne überflüssige Punkte (z.B. Graham Scan wobei bekannt ist, dass die Punkte in P ja schon sortiert sind.) } } Mein ihr das wäre effizient so als Online-Algorithmus? Oder doch lieber erst alle Punkte sammeln und dann Graham? Auf mehrere Worker-Threads liesse sich das auf jeden Fall schonmal verteilen. Ahnung wie man Ausreisser erkennen kann (z.b. Tippfehler)? Irgendeine Idee wie sich das mit dem disjunkt machen lässt? Irgendwer hatte sowas schon mal in Österreich gemacht. Erinnert sich noch wer daran wer das war und unter welchem Topic das auf welcher Mailingliste war? Marcus ___ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht
Hallo, marcus.wolsc...@googlemail.com wrote: ich suche gerade eine geeignete Möglichkeit um eine Lat+Lon - PLZ Abbildung zu machen. Ist mit den Daten, die OSM hat, sehr schwer. Du kannst zwar was basteln, aber Du wirst sehr viele falsche Ergebnisse erzielen, und gerade bei Anwendungen mit PLZ sind die Anforderungen der Benutzer eben doch oft hoeher - es mag fuer uns schon toll sein, wenn ich zu einem Ort in PLZ 76135 die 76133 erraten kann, aber fuer die meisten Benutzer gilt hier doch knapp daneben ist auch vorbei ;-) Momentan denke ich darüber nach disjunkte, konvexe Hüllen über alle Elemente welche innerhalb eines Staates den gleichen Wert in addr:postcode bzw postal_code haben zu bilden. Du wirst viele sich schneidende Huellen erhalten, und das gar nicht mal wegen Datenfehlern. Ausserdem werden grosse Flaechen leer bleiben. Fuer so etwas ist eigentlich ein Voronoi-Diagramm besser geeignet. Dave Stubbs hat damit ganz huebsche Ergebnisse fuer UK erzielt: http://random.dev.openstreetmap.org/postcodes/# aber ausserhalb der dichtbesiedelten Orte sieht es dort auch etwas mau aus. Bye Frederik ___ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de
Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht
2009/10/26 Frederik Ramm frede...@remote.org: Momentan denke ich darüber nach disjunkte, konvexe Hüllen über alle Elemente welche innerhalb eines Staates den gleichen Wert in addr:postcode bzw postal_code haben zu bilden. Du wirst viele sich schneidende Huellen erhalten, und das gar nicht mal wegen Datenfehlern. Ausserdem werden grosse Flaechen leer bleiben. Fuer so etwas ist eigentlich ein Voronoi-Diagramm besser geeignet. Dave Stubbs hat damit ganz huebsche Ergebnisse fuer UK erzielt: http://random.dev.openstreetmap.org/postcodes/# aber ausserhalb der dichtbesiedelten Orte sieht es dort auch etwas mau aus. Ich schätze ich werde am Ende also doch Voronoi nehmen müssen. Werd mal Dave anschreiben wie er das gemacht hat und ob seine Methode skaliert. Voronoi liefet mir zumindest auch gleich den Abstand vom nächsten Punkt der eine PLZ liefert. Ab Nx100m kann ich dann auf käufliche Datenbestände zurück fallen. Auf jeden Fall wäre es ein Anreiz die PLZ besser zu erfassen. Bei Polygonen, Multipolygonen und Wegen mit PLZ kommt der auf jeden Fall zum richtigen Ergebniss wenn man einfach die Punkte die PLZ erben lässt und dann nur Punkte betrachtet. Lief da nicht momentan für Deutschland ein Import mit Postleitzahlen? Gruss, Marcus ___ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de