2010/5/27 Marc SIBERT <[email protected]> > Le 27 mai 2010 13:55, René-Luc D'Hont <[email protected]> a écrit : > >> OUI, mais où ? >> >> _______________________________________________ >> Talk-fr mailing list >> [email protected] >> http://lists.openstreetmap.org/listinfo/talk-fr >> >> > Bonjour, > > Je relève le gant ! Avant même de l'intégrer dans un outils existant de > remonté d'erreurs... je me propose de faire une petite maquette de > faisabilité. > > Les principaux problèmes vont venir de la correspondance entre la table RFF > et les noms saisis dans OSM (typo, doublons, etc.). > > Étape n°1 passer le tableau RFF en table "base de données". >
Non l'étape 1 c'est de vérifier que la licence est compatible :P Maintenant, récemment quelqu'un sur la mailing list anglaise a utilisé *Levenshtein distance* pour trouver les similarités des noms. Il a essaye avec du soundex mais le résultat n'était pas hyper intéressant. Parmi les choses possibles en terme de recherche, il y a aussi l'utilisation de full text search sous Postgres par exemple. Je pense que le plus gros problème ça va être de voir comment les noms sont formatés dans les deux bases. Si les coordonnées sont incluses, on doit pouvoir restreindre les gares dans un région géographique alors pour permettre une meilleure correspondance. Sinon bon courage :) Emilie Laffray
_______________________________________________ Talk-fr mailing list [email protected] http://lists.openstreetmap.org/listinfo/talk-fr

