Le 21/06/2015 10:13, Christian Quest a écrit :
Le 21/06/2015 07:26, Julien Noblet a écrit :
Bonjour,
Le sam. 20 juin 2015 à 17:01, Christian Quest
<cqu...@openstreetmap.fr <mailto:cqu...@openstreetmap.fr>> a écrit :
Petit test très préliminaire d'addok contenant:
- les adresses de la BAN
- les POI extraits d'OSM
C'est ici: http://osm.cquest.org/addok.html
Super idée.
Quel est liste des catégories de POI extraits?
Je suis parti de la traduction du site OSM pour extraire une liste de
plus de 400 tags (traduits)
C'est sûrement à affiner, je vais mettre ça au propre et sur github.
https://github.com/openstreetmap/openstreetmap-website/blob/master/config/locales/fr.yml
J'ai attribué un "rank" (de 1 à 10) pour chaque type de POI, histoire
de classer les homonymes par ordre d'importance. Une gare est plus
importante qu'une gare routière, elle même plus importante qu'un arrêt
de bus, etc... c'est un peu subjectif et difficile quand on est dans
des thématique différentes (un hopital est-il plus important qu'un
musée ?)
Pour certains types, il faut qu'il y ait un nom pour qu'ils soient
indexés, pour d'autres, le nom vide est remplacé par la traduction du
type de POI. Du coup on peut trouver une boulangerie, même si il n'y a
que shop=bakery et pas de name=*
Je ne l'ai fait qu'à partir d'un certain rank, sinon chaque lampadaire
ou corbeille était indexé.
Il y a encore sûrement pas mal de ménage à faire c'est un premier jet.
Plus de 400.000 POI ponctuels sont indexés et 900.000 en surfacique
(là il y a sûrement du ménage à faire) et très peu de POI linéaires
(1786).
Ce qui va rendre le truc puissant, c'est l'automatisation du rank par
des retours de recherche (genre bayésien). Une recherche sur "SNCF"
donnera un rank élevé à "Gare", comme synonyme, et moindre à "point de
vente".
__
FrViPofm
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr