2010/5/27 Marc SIBERT <[email protected]>

> Le 27 mai 2010 13:55, René-Luc D'Hont <[email protected]> a écrit :
>
>>  OUI, mais où ?
>>
>> _______________________________________________
>> Talk-fr mailing list
>> [email protected]
>> http://lists.openstreetmap.org/listinfo/talk-fr
>>
>>
> Bonjour,
>
> Je relève le gant ! Avant même de l'intégrer dans un outils existant de
> remonté d'erreurs... je me propose de faire une petite maquette de
> faisabilité.
>
> Les principaux problèmes vont venir de la correspondance entre la table RFF
> et les noms saisis dans OSM (typo, doublons, etc.).
>
> Étape n°1 passer le tableau RFF en table "base de données".
>

Non l'étape 1 c'est de vérifier que la licence est compatible :P
Maintenant, récemment quelqu'un sur la mailing list anglaise a utilisé
*Levenshtein
distance* pour trouver les similarités des noms. Il a essaye avec du soundex
mais le résultat n'était pas hyper intéressant. Parmi les choses possibles
en terme de recherche, il y a aussi l'utilisation de full text search sous
Postgres par exemple. Je pense que le plus gros problème ça va être de voir
comment les noms sont formatés dans les deux bases.
Si les coordonnées sont incluses, on doit pouvoir restreindre les gares dans
un région géographique alors pour permettre une meilleure correspondance.

Sinon bon courage :)

Emilie Laffray
_______________________________________________
Talk-fr mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à