Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete gesucht

2009-10-28 Diskussionsfäden Jochen Topf
On Mon, Oct 26, 2009 at 06:11:08PM +0100, Marcus Wolschon wrote:
 2009/10/26 Frederik Ramm frede...@remote.org:
 
  Momentan denke ich darüber nach disjunkte, konvexe
  Hüllen über alle Elemente welche innerhalb eines Staates
  den gleichen Wert in addr:postcode bzw postal_code haben
  zu bilden.
 
  Du wirst viele sich schneidende Huellen erhalten, und das gar nicht mal
  wegen Datenfehlern. Ausserdem werden grosse Flaechen leer bleiben.
 
  Fuer so etwas ist eigentlich ein Voronoi-Diagramm besser geeignet. Dave
  Stubbs hat damit ganz huebsche Ergebnisse fuer UK erzielt:
 
  http://random.dev.openstreetmap.org/postcodes/#
 
  aber ausserhalb der dichtbesiedelten Orte sieht es dort auch etwas mau aus.
 
 Ich schätze ich werde am Ende also doch Voronoi nehmen müssen.
 Werd mal Dave anschreiben wie er das gemacht hat und ob seine
 Methode skaliert.
 Voronoi liefet mir zumindest auch gleich den Abstand vom nächsten
 Punkt der eine PLZ liefert. Ab Nx100m kann ich dann auf käufliche
 Datenbestände zurück fallen. Auf jeden Fall wäre es ein Anreiz die
 PLZ besser zu erfassen.
 Bei Polygonen, Multipolygonen und Wegen mit PLZ kommt der auf
 jeden Fall zum richtigen Ergebniss wenn man einfach die Punkte
 die PLZ erben lässt und dann nur Punkte betrachtet.

Ich hab das mit Voronoi mal gemacht. Für die Statistik-Sprache R gibts da Code.
Und für PostGIS gibts ein R-Plugin. Anleitung dazu gibts irgendwo im Web.
Grundsätzlich kommen, wenn zumindest ein paar Punkte mit PLZ vorhanden sind,
garnicht so schlechte Ergebnisse raus. Aber das ganze ist ziemlich langsam.
Eine einzelne Stadt bekommt man noch hin, aber für ganz Deutschland würde
es wohl Tage lang rechnen. Vielleicht kann man vorher die Punktmenge irgendwie
ausdünnen oder so.

Jochen
-- 
Jochen Topf  joc...@remote.org  http://www.remote.org/jochen/  +49-721-388298


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete gesucht

2009-10-28 Diskussionsfäden Jochen Topf
On Wed, Oct 28, 2009 at 10:28:08AM +0100, marcus.wolsc...@googlemail.com wrote:
 War das langsamer das Errechnen und speichern eines Voronoi-Diagramms oder
 die Abfrage eines nearest neighbor?

Das läßt sich ja so nicht vergleichen. Ich wollte ja die PLZ-Polygone haben.
Da hab ich ja keinen anderen Weg.

Wenn Du nur zu einem bekannten Punkt den nearest neighbors brauchst, bin ich
eigentlich ziemlich sicher, dass das schneller ist, den so zu berechnen, als
erst das Voronoi-Diagramm zu bauen.

Jochen
-- 
Jochen Topf  joc...@remote.org  http://www.remote.org/jochen/  +49-721-388298


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] Algorithmus für effiziente PLZ-Gebiete gesucht

2009-10-28 Diskussionsfäden Tobias Wendorff
Am Mi, 28.10.2009, 10:09 schrieb Jochen Topf:
 Für die Statistik-Sprache R gibts da
 Code.
 Und für PostGIS gibts ein R-Plugin. Anleitung dazu gibts irgendwo im Web.
 Grundsätzlich kommen, wenn zumindest ein paar Punkte mit PLZ vorhanden
 sind,
 garnicht so schlechte Ergebnisse raus. Aber das ganze ist ziemlich
 langsam.
 Eine einzelne Stadt bekommt man noch hin, aber für ganz Deutschland würde
 es wohl Tage lang rechnen.

Genauso habe ich es am Anfang auch gemacht.

Ich habe dann mal Qhull probiert, hat zwar keine Anbindung an PostGIS,
braucht man aber nicht.

Am Ende habe ich es dann aber mit ParallelPython gemacht:

Identische und zusammengehörige PLZ einzeln in CSVs, dann parallel in
Thiessen-Polygone mit einer sehr großen Umgebungsfläche.

Die Ergebnisse habe ich dann miteinander verschnitten.


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de