Hallo.

Am Sonntag 19 April 2009 17:24:12 schrieb Gernot Hillier:
> Ok, einverstanden, dass man es in dieser Richtung löst. Nur leider gibt
> es das nicht in der OSM-Datenbank. Es gibt nur die Möglichkeit, Strings
> zu erfassen, die mit Glück dem Namen des Parent entsprechen. Du kannst
> aber mit an Sicherheit grenzender Wahrscheinlichkeit davon ausgehen,
> dass du mindestens Tippfehler im einstelligen Prozentbereich hast.

Das ist ein Informatikerargument.

Wenn du an jeder Straße Informationen der Art
  name=Foobarstraße
  city=X-Y-Stadt
hast, dann ist die Wahrscheinlichkeit für einen Fehler bei name erstmal gleich 
groß wie bei city. Und wie viele falsch geschriebene Straßennamen haben wir in 
der Datenbank? Meiner Beobachtung nach maximal im Promillebereich. Für die 
Städtenamen tippe ich also auf nicht mehr.

Zudem kann man recht einfach mit Tools ausgeben lassen, welche Ortsnamen in 
einer gewissen bounding-Box gesetzt wurden und erkennt Tippfehler sehr 
schnell. Editoren können einem dabei einfach helfen, siehe KA-
Hausnummernschema.


> Namen aus der realen Welt sind einfach als ID wegen der
> Wahrscheinlichkeit für Tippfehler, Zeichensatzencodings, etc. relativ
> ungeeignet.

Du siehst das zu sehr als Informatiker. Alles braucht eine (numerische) ID, 
diesen Drang kenne ich. ;-)

Aber die Praxis zeigt, dass
1. Namen als ID funktionieren. Siehe KA-Schema und was man schon jetzt damit 
alles machen kann
und
2. allem eine zusätzliche ID zu geben (maschinen- oder menschenlesbar) die 
Komplexität stark erhöht und die Fehler dann auf anderem Level passieren und 
nicht so einfach erkennbar bzw. behebbar sind wie einfache Tippfehler bei 
Namen.

Gruß, Bernd

-- 
Columbus hatte in Wirklichkeit vier Schiffe -
das vierte segelte über die Kante

Attachment: signature.asc
Description: This is a digitally signed message part.

_______________________________________________
Talk-de mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an