Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht

2009-10-28 Diskussionsfäden marcus.wolschon
On Wed, 28 Oct 2009 10:09:07 +0100, Jochen Topf joc...@remote.org wrote:
 Ich hab das mit Voronoi mal gemacht. Für die Statistik-Sprache R gibts
da
 Code.
 Und für PostGIS gibts ein R-Plugin. Anleitung dazu gibts irgendwo im
Web.
 Grundsätzlich kommen, wenn zumindest ein paar Punkte mit PLZ vorhanden
 sind,
 garnicht so schlechte Ergebnisse raus. Aber das ganze ist ziemlich
langsam.
 Eine einzelne Stadt bekommt man noch hin, aber für ganz Deutschland
würde
 es wohl Tage lang rechnen. Vielleicht kann man vorher die Punktmenge
 irgendwie
 ausdünnen oder so.

War das langsamer das Errechnen und speichern eines Voronoi-Diagramms oder
die Abfrage eines nearest neighbor?

Marcus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


[Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht

2009-10-26 Diskussionsfäden marcus.wolschon

Hallo Leute,

ich suche gerade eine geeignete Möglichkeit um eine
Lat+Lon - PLZ Abbildung zu machen.

Momentan denke ich darüber nach disjunkte, konvexe
Hüllen über alle Elemente welche innerhalb eines Staates
den gleichen Wert in addr:postcode bzw postal_code haben
zu bilden.
Dann könnte man über diese Polygone eine sehr, sehr grosse
Anzahl an Positionen ihren PLZ-Werten zuordnen.

Meine erste Idee wäre:

für alle (Punkte p welche eine PLZ haben oder Teil eines Weges/Gebietes
mit einer PLZ sind) tue:
  {
 Suche das Polygon P zu dieser PLZ+Staat -Kombination.
 Falls P nicht existiert, 
   {
  lege P mit diesem eine Punkt an.
   }
 Falls P existiert und p nicht in P enthalten ist:
   {
  Füge p dem Polygon P hinzu und entferne überflüssige Punkte
  (z.B. Graham Scan wobei bekannt ist, dass die Punkte in
   P ja schon sortiert sind.)
   }
  }

Mein ihr das wäre effizient so als Online-Algorithmus?
Oder doch lieber erst alle Punkte sammeln und dann Graham?
Auf mehrere Worker-Threads liesse sich das auf jeden Fall
schonmal verteilen.

Ahnung wie man Ausreisser erkennen kann (z.b. Tippfehler)?

Irgendeine Idee wie sich das mit dem disjunkt machen lässt?

Irgendwer hatte sowas schon mal in Österreich gemacht.
Erinnert sich noch wer daran wer das war und unter welchem
Topic das auf welcher Mailingliste war?

Marcus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht

2009-10-26 Diskussionsfäden Frederik Ramm
Hallo,

marcus.wolsc...@googlemail.com wrote:
 ich suche gerade eine geeignete Möglichkeit um eine
 Lat+Lon - PLZ Abbildung zu machen.

Ist mit den Daten, die OSM hat, sehr schwer. Du kannst zwar was basteln, 
aber Du wirst sehr viele falsche Ergebnisse erzielen, und gerade bei 
Anwendungen mit PLZ sind die Anforderungen der Benutzer eben doch oft 
hoeher - es mag fuer uns schon toll sein, wenn ich zu einem Ort in PLZ 
76135 die 76133 erraten kann, aber fuer die meisten Benutzer gilt hier 
doch knapp daneben ist auch vorbei ;-)

 Momentan denke ich darüber nach disjunkte, konvexe
 Hüllen über alle Elemente welche innerhalb eines Staates
 den gleichen Wert in addr:postcode bzw postal_code haben
 zu bilden.

Du wirst viele sich schneidende Huellen erhalten, und das gar nicht mal 
wegen Datenfehlern. Ausserdem werden grosse Flaechen leer bleiben.

Fuer so etwas ist eigentlich ein Voronoi-Diagramm besser geeignet. Dave 
Stubbs hat damit ganz huebsche Ergebnisse fuer UK erzielt:

http://random.dev.openstreetmap.org/postcodes/#

aber ausserhalb der dichtbesiedelten Orte sieht es dort auch etwas mau aus.

Bye
Frederik




___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete g esucht

2009-10-26 Diskussionsfäden Marcus Wolschon
2009/10/26 Frederik Ramm frede...@remote.org:

 Momentan denke ich darüber nach disjunkte, konvexe
 Hüllen über alle Elemente welche innerhalb eines Staates
 den gleichen Wert in addr:postcode bzw postal_code haben
 zu bilden.

 Du wirst viele sich schneidende Huellen erhalten, und das gar nicht mal
 wegen Datenfehlern. Ausserdem werden grosse Flaechen leer bleiben.

 Fuer so etwas ist eigentlich ein Voronoi-Diagramm besser geeignet. Dave
 Stubbs hat damit ganz huebsche Ergebnisse fuer UK erzielt:

 http://random.dev.openstreetmap.org/postcodes/#

 aber ausserhalb der dichtbesiedelten Orte sieht es dort auch etwas mau aus.

Ich schätze ich werde am Ende also doch Voronoi nehmen müssen.
Werd mal Dave anschreiben wie er das gemacht hat und ob seine
Methode skaliert.
Voronoi liefet mir zumindest auch gleich den Abstand vom nächsten
Punkt der eine PLZ liefert. Ab Nx100m kann ich dann auf käufliche
Datenbestände zurück fallen. Auf jeden Fall wäre es ein Anreiz die
PLZ besser zu erfassen.
Bei Polygonen, Multipolygonen und Wegen mit PLZ kommt der auf
jeden Fall zum richtigen Ergebniss wenn man einfach die Punkte
die PLZ erben lässt und dann nur Punkte betrachtet.

Lief da nicht momentan für Deutschland ein Import mit Postleitzahlen?


Gruss,
Marcus

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de