Hallo, Michael Roth wrote: > Denn der Mensch kann erkennen dass mit "Germany" offensichtlich "BRD" > gemeint ist. Dieses Wissen kann er manuell per Hand anwenden oder in ein > Skript packen.
Oder gleich in die Software, die die Daten auswertet (bzw., um Mehrarbeit zu vermeiden, zwischen die Datenbank und diese Software). *Entweder* gibt es eine gute Moeglichkeit, irgendetwas automatisch zu "korrigieren". Dann ist es doch 10x besser, ich baue das z.B. in den Name Finder ein, wenn der seine Indexdatenbank aufbaut o.ae., als dass ich den Name Finder so programmiere, dass er nur mit einem bestimmten Format auskommt, und dann brauche ich ein Skript, das taeglich dafuer sorgt, dass auch nur dieses in der Datenbank vorkommt. *Oder* es gibt diese Moeglichkeit nicht, weil menschliche Intelligenz vonnoeten ist, um die Entscheidung zu treffen; dann kann man sowieso keine automatisierte Aenderung machen. Ich vertrete die Ansicht, dass reine Schoenheitskorrekturen wertlos sind. Wenn in Deutschland 10.000 Strassen mit max_speed und 10.000 Strassen mit maxspeed getaggt waeren, kaeme bestimmt irgendjemand und wuerde fordern, dass man das gleichzieht. Aber man braucht das nicht in der Datenbank zu machen, man kann das auch bei der Entnahme der Daten aus der Datenbank tun; dann ist man auf der sicheren Seite und weiss *genau*, was rauskommt, waehrend man ansonsten nie weiss, ob seit dem letzten Bot-Lauf vor einer Woche vielleicht wieder ein max_speed hinzugekommen ist. Ausserdem kann bei dieser, von mir bevorzugten Vorgehensweise jeder selbst entscheiden, welchen Umfang an Saeuberungen er wuenscht. In meinen Augen ist waere es wertvoll, Zeit darauf zu verwenden, sich zu ueberlegen, wie man mit den chaotischen Daten in OSM besser umgehen kann, anstatt den Versuch zu unternehmen, das Chaos zu beseitigen. Ich nehme an, dass das Ausmass an Chaos, das durch neue Nutzer taeglich hinzukommt, immer groesser wird, und ein staendiges Hinterherraeumen durch hunderte von Bots zunehmend unpraktikabel wird. Nimm das Beispiel "Strasse" - *kein* gescheites OSM-Programm wird es sich je leisten koennen, die Schreibweise mit Doppel-S einfach zu ignorieren, zu viele neue so geschriebene Strassen kommen staendig hinzu. Aber wenn jedes Programm, das die Daten weiterverarbeitet, ohnehin mit beiden Schreibungen klarkommen muss - wozu dann die Saeuberungsaktion? Blaeht die History auf, erschwert die Interpretation von Autoren- und Rechtesituation, und nach ein paar Monaten ist schon wieder "Gras drueber gewachsen". Bye Frederik -- Frederik Ramm ## eMail [EMAIL PROTECTED] ## N49°00'09" E008°23'33" _______________________________________________ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de