> Il existe https://github.com/rezemika/humanized_opening_hours > https://zestedesavoir.com/billets/2653/quelques-statistiques-sur-le-champ-opening-hours-dopenstreetmap/?page=1#p227797
Merci David pour ces liens :) Je ne peux répondre malheureusement à ta question Noémie :/ Mais l'article et ses commentaires traitent de questions intéressantes pour nous, les utilisateurs francophones 😀 Quelques remarques : En lisant les commentaires, j'avais l'impression qu'il analysait la grammaire (un sous ensemble) à la main. Ouf, il utilise une bibliothèque pour le faire : Lark <https://lark-parser.readthedocs.io/en/latest/> :) Je devine donc qu'il ne traite volontairement qu'une partie de la grammaire pour pouvoir l'afficher en français. Il fait des statistiques sur les valeurs du tags qui sont valides ou pas. Il existe déjà un projet <https://github.com/opening-hours/opening_hours-statistics> pour ça : https://openingh.openstreetmap.de/stats/ En jouant avec les courbes on peut voir la proportion de valeurs qui affichent des avertissement ou qui pourraient être enjolivées. Il semblerait que 98.9% des valeurs soient valides (ce qui ne veux pas dire qu'elles soient correctes). Ça fait quand même ~21 000 valeurs à corriger. On retrouve ces stats pour les autres clés dont opening_hours:covid19 😉 Il fait aussi un nettoyage partiel à l'aide d'expressions rationnelles (regex = regular expressions). J'ai fait un travail similaire dans mon coin (par exemple remplacer 10h à 12h par 10:00-12:00). Et aussi ouvert un ticket <https://github.com/opening-hours/opening_hours.js/issues/329> dans le dépôt de opening_hours.js Je propose aux personnes intéressées par ce sujet de travailler en commun pour faciliter la saisie, éviter les erreurs les plus courantes : mise à point de regex, automatiser tout ça dans un formulaire en ligne simple a utiliser, et surtout, tester (donc pas besoin d'être un expert) 😀 On n'arrivera jamais à 100% de corrections automatiques, mais on peut améliorer fortement (et "facilement") les saisies à la française. Notamment les copier/coller de sites bien connus (Google, Facebook…). Il est aussi possible de moissonner les horaires : quelques sites indiquent les horaires sous forme de microformats <https://fr.wikipedia.org/wiki/Microformat> compréhensibles par une machine. Au passage il existe le greffon JOSM Microdata Scraping <https://gitlab.com/vucod/microdata-scraping> qui les utilisent pour rajouter les infos d'un contact (horaires d'ouverture, n° de téléphone, adresse, mél, moyens de paiement…) __ Yves Dans ce que j'ai pu observer, beaucoup de valeurs qui ne sont pas compréhensibles par la machine sont en fait des expressions en langue naturelle (pour nous le français). L'explication ? Soit que ce sont des contributeurs débutants qui ne savent pas qu'il faut utiliser une grammaire, Soit que c'est trop compliqué, ou qu'on a pas le temps, et du coup ils copient ce qu'un humain va comprendre
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-fr