> Il existe https://github.com/rezemika/humanized_opening_hours
> https://zestedesavoir.com/billets/2653/quelques-statistiques-sur-le-champ-opening-hours-dopenstreetmap/?page=1#p227797

Merci David pour ces liens :)

Je ne peux répondre malheureusement à ta question Noémie :/

Mais l'article et ses commentaires traitent de questions intéressantes pour 
nous, les utilisateurs francophones 😀

Quelques remarques :
En lisant les commentaires, j'avais l'impression qu'il analysait la grammaire 
(un sous ensemble) à la main.
Ouf, il utilise une bibliothèque pour le faire : Lark 
<https://lark-parser.readthedocs.io/en/latest/> :)

Je devine donc qu'il ne traite volontairement qu'une partie de la grammaire 
pour pouvoir l'afficher en français.


Il fait des statistiques sur les valeurs du tags qui sont valides ou pas.
Il existe déjà un projet 
<https://github.com/opening-hours/opening_hours-statistics> pour ça : 
https://openingh.openstreetmap.de/stats/

En jouant avec les courbes on peut voir la proportion de valeurs qui affichent 
des avertissement ou qui pourraient être enjolivées.
Il semblerait que 98.9% des valeurs soient valides (ce qui ne veux pas dire 
qu'elles soient correctes).
Ça fait quand même ~21 000 valeurs à corriger.

On retrouve ces stats pour les autres clés dont opening_hours:covid19 😉


Il fait aussi un nettoyage partiel à l'aide d'expressions rationnelles (regex = 
regular expressions).
J'ai fait un travail similaire dans mon coin (par exemple remplacer 10h à 12h 
par 10:00-12:00).
Et aussi ouvert un ticket 
<https://github.com/opening-hours/opening_hours.js/issues/329> dans le dépôt de 
opening_hours.js 

Je propose aux personnes intéressées par ce sujet de travailler en commun  pour 
faciliter la saisie, éviter les erreurs les plus courantes :
mise à point de regex,
automatiser tout ça dans un formulaire en ligne simple a utiliser,
et surtout, tester (donc pas besoin d'être un expert) 😀
On n'arrivera jamais à 100% de corrections automatiques, mais on peut améliorer 
fortement (et "facilement") les saisies à la française.
Notamment les copier/coller de sites bien connus (Google, Facebook…).


Il est aussi possible de moissonner les horaires : quelques sites indiquent les 
horaires sous forme de microformats <https://fr.wikipedia.org/wiki/Microformat> 
compréhensibles par une machine.
Au passage il existe le greffon JOSM Microdata Scraping 
<https://gitlab.com/vucod/microdata-scraping> qui les utilisent pour rajouter 
les infos d'un contact (horaires d'ouverture, n° de téléphone, adresse, mél, 
moyens de paiement…)

__
Yves

Dans ce que j'ai pu observer, beaucoup de valeurs qui ne sont pas 
compréhensibles par la machine sont en fait des expressions en langue naturelle 
(pour nous le français).

L'explication ?
Soit que ce sont des contributeurs débutants qui ne savent pas qu'il faut 
utiliser une grammaire,
Soit que c'est trop compliqué, ou qu'on a pas le temps, et du coup ils copient 
ce qu'un humain va comprendre






_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à