Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-12-02 Par sujet Topographe Fou
Je parlais de Maproulette pour corriger les tags wikipedia incohérents (tels 
que ceux signalés en début de fil) si il y en a "trop". Si il y en a "peu", 
cela peut être fait sans passer par ce service par un contributeur motivé.


LeTopographeFou


  Message original  


De: yves.prat...@gmail.com
Envoyé: 1 décembre 2019 9:20 PM
À: talk-fr@openstreetmap.org
Répondre à: talk-fr@openstreetmap.org
Objet: Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?


@Topographe Fou
> De même que de pouvoir s'interfacer avec d'autres bdd qui utiliseraient cette 
> clé publique comme osm.

J’ai réussi à faire des requête SPARQL entre wikidata et OSM. En fait on peut 
faire des requête entre pleins de bases de connaissances :
Par exemple, les catalogues de grandes bibliothèques pour trouver des photos, 
vérifier des noms, trouver des articles…

> Et pourquoi pas lancer un maproulette pour les erreurs détectées ?

Avec des requêtes SPARQL, on peut non seulement vérifier que la valeur des tags 
wikidata ou wikipedia est correcte avec une expression régulière,
mais carrément, on peut vérifier que l’élément ou l’article existe bien,
que la page ne soit pas une page de redirection,
que l’élément wikidata corresponde bien à l’objet OSM (j’ai des tags 
man_made=lighthouse, la nature de l’élément wikidata doit être « phare »),
trouver la population d’une ville,
…

—
Yves
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-12-01 Par sujet Yves P.
@Jérôme

> L’intérêt de le mettre sur wikidata, c’est que ce dernier est plus général; 
> les expressions régulières souvent  existent déjà… Pourquoi réinventer la 
> roue ?
> 
> Il n'y a pas les expressions régulières pour les tag OSM, si?
Si. La valeur étant la même, tu peut appliquer l’expression rationnelle aussi 
au tag OSM.
On peut aussi trouver l’URL pour générer des liens à partir d’un identifiant

J’avais fait une requête SPARQL qui listait ça : https://w.wiki/D5z

> 
> Il y a un serveur SPARQL pour OSM : il permet d’interroger les données OSM 
> (et des bases de connaissances externes comme wikidata).
> Il s’appel Sophox  ?
> 
> J'ai vu ça mais j'ai jamais testé... et je comprend pas trop ce que ça 
> apporte par rapport à overpass.
J’ai donné des exemples dans ma réponse au Topographe fou.

Voici une requête SPARQL dans wikidata qui affiche sur une carte les phares qui 
sont dans OSM : https://w.wiki/D5g


Bonne soirée,

—
Yves___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-12-01 Par sujet Yves P.
@Topographe Fou
> De même que de pouvoir s'interfacer avec d'autres bdd qui utiliseraient cette 
> clé publique comme osm.

J’ai réussi à faire des requête SPARQL entre wikidata et OSM. En fait on peut 
faire des requête entre pleins de bases de connaissances :
Par exemple, les catalogues de grandes bibliothèques pour trouver des photos, 
vérifier des noms, trouver des articles…

> Et pourquoi pas lancer un maproulette pour les erreurs détectées ?

Avec des requêtes SPARQL, on peut non seulement vérifier que la valeur des tags 
wikidata ou wikipedia est correcte avec une expression régulière,
mais carrément, on peut vérifier que l’élément ou l’article existe bien,
que la page ne soit pas une page de redirection,
que l’élément wikidata corresponde bien à l’objet OSM (j’ai des tags 
man_made=lighthouse, la nature de l’élément wikidata doit être « phare »),
trouver la population d’une ville,
…

—
Yves
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-12-01 Par sujet Yves P.
Bonsoir,


@Philippe
> Je ne vois que des avantages à Wikidata... sauf […qu’il] faut aussi 
> contribuer à Wikimedia

> ensuite il faut aussi se former aux outils Wikimedia et apprendre à utiliser 
> Wikidata (ce qui est beaucoup moins simple que pour Wikipédia).
J’ai bien galèré avec la syntaxe wiki 
Pour wikidata, la saisie est « visuelle » et on s’y fait vite.

Ce qui est « compliqué », c’est de savoir comment sont organisés les éléments, 
connaitre leur propriétés…
C’est relativement facile avec les contraintes qui indiquent tout de suite 
qu’il y a un problème.

Et il « suffit » d’observer un élément connu pour savoir comment s’y prendre.

—
Yves


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-30 Par sujet Jérôme Amagat
Le sam. 30 nov. 2019 à 10:37, Yves P.  a écrit :

> le validateur de JOSM corrige cette erreur, les _ à la place d'espace.
> L'erreur est indiqué par le validateur et "réparer" remplace les _ par des
> espaces.
>
> Oui, le problème comme tu l’indiques plus bas et de faire les corrections
> sans s’attirer les foudres des communautés OSM
>
> Moi aussi je me suis fais plusieurs fois taper sur les doigts parce que
> j'envoyais des données sur plusieurs continent en même temps :) , ça plaît
> pas à certains qui, avec je sais plus quel outils, suivent les changset sur
> leur zones et donc un changset mondial, ça bip chez tout le monde :). Mais
> je pense pas qu'il y ai besoin de couper par pays, par "région" qui peut
> englober plusieurs pays ça suffit.
>
> Pas toujours 
> Je connais un contributeur qui utilise OSMcha  pour
> « surveiller » un territoire de métropole, et un changeset qui couvre toute
> la France va être détecté, même si il n’y a aucune modifications dans son
> territoire.
>

Oui c'est pour ça que je pense que la découpe par pays ce n'est pas le plus
intéressant, il faut découper l'envoi pour avoir une "surface" de changeset
la plus petite possible. En envoyant plusieurs changesets, si leur ensemble
recouvre une surface presque équivalente au monde entier, tout le monde
aura, avec OSMcha, un changeset pour son "territoire" donc pareil qu'avec
un changeset mondial :)

>
> Dans JOSM, je sélectionne un grand rectangle :) ou mieux (comme ça, ça
> sélectionne les relations) une recherche "(new or modified)  inview" en ce
> plaçant correctement, ne pas oublier les ( ) la dernière fois que j'ai été
> interpelé, je suis allé trop vite et les ai oublié donc dans la sélection
> il y avait des élements dans le monde entier :(  et après fichier -> envoyé
> la sélection.
>
> Je fais ça aussi. Parfois avant de faire envoyer la sélection
> CMD+ALT+MAJ+U, je dois faire machinalement un CTRL+A et j’envoi un gros
> bazar !
>
> Par contre, le gros problème c'est pour les éléments supprimés, il faut
> pas en avoir sinon on se retrouve avec à la fin et pas moyen de les
> sélectionner :(
>
> En fait il faut réussir à cibler ses modifications
>
> Pour les expression régulière et leur stockage, il est possible de les
> placer dans l'espèce de wikidata du wiki d'osm, les éléments OpenStreetMap
> Wiki, avec la propriété "Expression régulière pour valider la valeur" P13 (
> https://wiki.openstreetmap.org/wiki/Property:P13)
> Je l'ai fais il y a quelque temps ici :
> https://wiki.openstreetmap.org/wiki/Item:Q1273
> pour wikidata , c'est ici : https://wiki.openstreetmap.org/wiki/Item:Q827
> et wikipedia là : https://wiki.openstreetmap.org/wiki/Item:Q828
>
> Je ne connaissais pas, mais j’ai peur de ne pas être le seul. 類
>
> L’intérêt de le mettre ici, c’est que ça reste sur les serveurs OSM.
>

Oui, exactement, comme ça l'info est stocké quelque part.


> Encore faut-il que les développeurs le connaissent ?
>

S'il n'y a rien sur ces éléments OSM wiki, les développeurs ne
l'utiliseront pas et ... inversement. Il faut bien commencer quelque part.


> Tient, on pourra à terme virer toute une partie du wiki 
> (comme pour les boites dans wikipedia qui sont remplies automatiquement
> par des données wikidata).
>
> L’intérêt de le mettre sur wikidata, c’est que ce dernier est plus
> général; les expressions régulières souvent  existent déjà… Pourquoi
> réinventer la roue ?
>

Il n'y a pas les expressions régulières pour les tag OSM, si?
Comme wikidata, ça permet d'avoir des infos faciles à utiliser par un
robot, facile de créé une page dans une autre langue vu que la bande de
droite se remplit toute seul, permet de lier les pages des différentes
langues.

>
>
> Par contre, 2 remarques, l'expression régulière doit être tel que il sera
> ajouté "^(" avant et ")$" après, je comprends pas pourquoi cette
> restriction.
>
> Peux-tu donner des exemples ?
>

On peut toujours s'arranger avec ça mais pour moi le "^" et le "$" font
partie de l'expression régulière et il y a un soucis sur la page, on dit
qu'il sera ajouté "^(" avant et ")$" après, mais dans "format de l'url" il
n'y a pas les parenthèses.

>
> Et je sais pas comment on fait une recherche dans ce wikidata OSM, le seul
> moyen d'y accéder c'est par les pages "normales" et sur la colonne de
> gauche "élément OpenStreetMap Wiki »
>
> ça correspond dans wikipedia à Élément Wikidata.
>
> J’ai peut-être trouvé une piste 
> Il y a un serveur SPARQL pour OSM : il permet d’interroger les données OSM
> (et des bases de connaissances externes comme wikidata).
> Il s’appel Sophox  ?
>

J'ai vu ça mais j'ai jamais testé... et je comprend pas trop ce que ça
apporte par rapport à overpass.


> Je ne sais pas encore comment interroger le wikidata d’OSM que tu décris
> plus haut, par contre j’arrive bien à interroger les données OSM :
>
> Requête SPARQL des objets ayant un identifiant NGA (les feux, phares,
> bouées et 

Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-30 Par sujet Yves P.
> le validateur de JOSM corrige cette erreur, les _ à la place d'espace.
> L'erreur est indiqué par le validateur et "réparer" remplace les _ par des 
> espaces.
Oui, le problème comme tu l’indiques plus bas et de faire les corrections sans 
s’attirer les foudres des communautés OSM

> Moi aussi je me suis fais plusieurs fois taper sur les doigts parce que 
> j'envoyais des données sur plusieurs continent en même temps :) , ça plaît 
> pas à certains qui, avec je sais plus quel outils, suivent les changset sur 
> leur zones et donc un changset mondial, ça bip chez tout le monde :). Mais je 
> pense pas qu'il y ai besoin de couper par pays, par "région" qui peut 
> englober plusieurs pays ça suffit.
Pas toujours 
Je connais un contributeur qui utilise OSMcha  pour 
« surveiller » un territoire de métropole, et un changeset qui couvre toute la 
France va être détecté, même si il n’y a aucune modifications dans son 
territoire.

> Dans JOSM, je sélectionne un grand rectangle :) ou mieux (comme ça, ça 
> sélectionne les relations) une recherche "(new or modified)  inview" en ce 
> plaçant correctement, ne pas oublier les ( ) la dernière fois que j'ai été 
> interpelé, je suis allé trop vite et les ai oublié donc dans la sélection il 
> y avait des élements dans le monde entier :(  et après fichier -> envoyé la 
> sélection.
Je fais ça aussi. Parfois avant de faire envoyer la sélection CMD+ALT+MAJ+U, je 
dois faire machinalement un CTRL+A et j’envoi un gros bazar !

> Par contre, le gros problème c'est pour les éléments supprimés, il faut pas 
> en avoir sinon on se retrouve avec à la fin et pas moyen de les sélectionner 
> :(
En fait il faut réussir à cibler ses modifications

> Pour les expression régulière et leur stockage, il est possible de les placer 
> dans l'espèce de wikidata du wiki d'osm, les éléments OpenStreetMap Wiki, 
> avec la propriété "Expression régulière pour valider la valeur" P13 
> (https://wiki.openstreetmap.org/wiki/Property:P13 
> ) 
> Je l'ai fais il y a quelque temps ici : 
> https://wiki.openstreetmap.org/wiki/Item:Q1273 
> 
> pour wikidata , c'est ici : https://wiki.openstreetmap.org/wiki/Item:Q827 
>  et wikipedia là : 
> https://wiki.openstreetmap.org/wiki/Item:Q828 
> Je ne connaissais pas, mais 
> j’ai peur de ne pas être le seul. 類

L’intérêt de le mettre ici, c’est que ça reste sur les serveurs OSM.
Encore faut-il que les développeurs le connaissent ?
Tient, on pourra à terme virer toute une partie du wiki 
(comme pour les boites dans wikipedia qui sont remplies automatiquement par des 
données wikidata).

L’intérêt de le mettre sur wikidata, c’est que ce dernier est plus général; les 
expressions régulières souvent  existent déjà… Pourquoi réinventer la roue ?

> 
> Par contre, 2 remarques, l'expression régulière doit être tel que il sera 
> ajouté "^(" avant et ")$" après, je comprends pas pourquoi cette restriction.
Peux-tu donner des exemples ?

> Et je sais pas comment on fait une recherche dans ce wikidata OSM, le seul 
> moyen d'y accéder c'est par les pages "normales" et sur la colonne de gauche 
> "élément OpenStreetMap Wiki »
ça correspond dans wikipedia à Élément Wikidata.

J’ai peut-être trouvé une piste 
Il y a un serveur SPARQL pour OSM : il permet d’interroger les données OSM (et 
des bases de connaissances externes comme wikidata).
Il s’appel Sophox  ?

Je ne sais pas encore comment interroger le wikidata d’OSM que tu décris plus 
haut, par contre j’arrive bien à interroger les données OSM :

Requête SPARQL des objets ayant un identifiant NGA (les feux, phares, bouées et 
balises maritimes) : https://tinyurl.com/susuzyf
Ici par vraiment d’intérêt par rapport à Overpass-Turbo (hormis que c’est comme 
sous wikidata, on peut présenter les « connaissances » sous pleins de formes 
tableaux, cartes,…)

L'un des intérêts est de pouvoir « croiser » ces données avec wikidata ou une 
autre base de connaissance (ontologie).
(Je n’est pas encore testé).

J’ai découvert Navigae qui permet de consulter des données issues de travaux en 
géographie. Une requête sur « Phare » renvoie des cartes et photos anciennes :
https://www.navigae.fr/map?textSearch=phare=fr 


Une autre est de pouvoir utiliser l’outil OpenRefine 
 et un service de reconciliation 
capable d’interroger n’importe quel point d’entrée SPARQL.
Je l’ai testé pour retrouvé des objets OSM à partir de données au format CSV. 
Je faisais une requête overpass pour chaque objet, mais sans pouvoir utiliser 
la réconciliation, ou du moins que sur le nom et pas sur la géométrie.

—
Yves


___
Talk-fr mailing list

Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-28 Par sujet Philippe Verdy
Je ne vois que des avantages à Wikidata... sauf que pour contribuer à OSM
alors les conditions d'utilisation OSM ne sont plus suffisantes, il faut
aussi contribuer à Wikimedia et accepter aussi les termes Wikimedia et y
disposer d'un autre compte. ensuite il faut aussi se former aux outils
Wikimedia et apprendre à utiliser Wikidata (ce qui est beaucoup moins
simple que pour Wikipédia).
Il faudrait que les outils OSM fassent comme Wikipédia: inclure les
"moulinettes" qui permettent de contribuer indirectement à Wikidata de
façon plus simple que par l'interface Wikidata par défaut. Il faudrait
aussi que les éditeurs OSM incluent la création ou la connexion à un compte
Wikimedia et l'acceptation de ses propres conditions d'utilisation. Ensuite
ces outils OSM n'ont pas besoin de générer toutes les données Wikidata,
juste celles qu'OSM va utiliser: il semble suffisant que cet éditeur puisse
trouver les articles Wikipédia (dans n'importe quelle langue) puis leur Id
Q Wikidata et aussitôt alors proposer de mettre ce Wikidata et se
passer de Wikipédia dan les données OSM.

Les noms par défaut et traductions peuvent être trouvées aussi dans
Wikidata et on doit pouvoir y contribuer directement avec son compte
Wikimedia (de préférence un compte SUL, mais attention car certains comptes
Wikimedia n'on pas pu être unifiés et les noms d'utilisateurs peuvent être
différents selon les wikis : l'utilisateur Wikipédia et l'utilisateur
Wikidata n'est pas toujours le même, surtou si ce sont des comptes anciens
mais toujours actifs, datant d'avant les logins unifiés, et la fusion n'a
pas toujours été possible si les comptes en conflits étaient actifs tous
les deux et aucun n'a accepté de changer son nom d'utilisateur local car
Wikimédia n'a pas voulu ni obligé personne à abandonner son nom
d'utilisateur actif au profit d'un autre, sachant que le renommage de
comptes pose des tas de difficultés, demande des ressorues importantes sur
les serveurs pour modifier des tas de pages, et que tout n'est pas toujours
trouvé à cause des modèles ou des préférences locales des utilisateurs,
dont les javascripts utilisateur dans leurs pages personelles que Wikimedia
s'interdit d'altérer au risque de créer des problèmes de sécurité sur les
PC de ces utilisateurs; enfin de tels renommages nécessitent un procvessus
complexe d'approbation et une surveillance par les admins qui doivent être
mis au courant des problèmes ultérieurs que cela peut provoquer, afin
d'éviter des usages abusifs ou de bloquer un utilisateur pour une mauvaise
raison liéé à une confusions entre utilisateurs différents pour des actions
réalisées à des dates d'avant ou après le renommage; il y a le risque que
durant la migration cela ouvre la porte à des spammeurs et toutes sortes
d'abus: le processus de renommage n'est pas sans risque en terme de
sécurité individuelle ou collective et il y a aussi des problèmes de
gestion des droits, notamment du droit d'auteur et des licences accordées
qui pourraient s'avérer invalides après; de tels renomages doivent donc
être historisés de façon fiable pour résoudre correctement tout conflit
ultérieur, et éviter qu'une nouvelle demande de vérification de droits à un
utilisateur aboutisse à la mauvaise personne qui ne répondra pas ou
répondra à mauvais escient, puis au retrait illégitime des droits et la
suppression d'anciennes modifs pourtant tout à fait valides sans avoir
avisé l'auteur initial à son nouveau compte).

Ceci dit, quand Wikidata est activé sur les éléments qu'on cherche, il
devrait servir de base et au lieu d'ajouter ou modifier des traductions
dans OSM, on pourra le faire sur Wikidata à la place et cela doit être
automatisable, même au sein des éditeurs OSM, devenus des éditeurs
OSM+Wikidata, sans même avoir ensuite à utiliser l'interface web de
Wikidata. Des bots OSM peuent aussi trouver les redondances et pourront
nettoyer OSM de ce qui n'est plus nécessaire après avoir vérifié les
redondances restantes et l'absence de conflits. Pour le reste les bots
peuvent lister les problèmes trouvés et les inscrire dans une
"maproulette", où selon le cas il faudra modifier soit les données OSM soit
celles de Wikidata par des outils d'édition plus avancés et distinctifs,
que des utilisateurs plus avancés maitrisant chaque environnement pourront
aller "nettoyer" à la main.

Note: il y a aussi du nettoyage à faire dans Wikidata, mais Wikidata a
aussi ses bots de vérification et ses longues listes de tâches à faire (les
modèles de données évoluent aussi, des éléments dont lobjet de fusion ou
scission et de désambiguisation, il y a aussi des entrées en doublon non
fusionnées automatiquement à cause de conflits internes à Wikidata). Ce
n'est pas simple non plus, et les utilisateurs avancés de Wikidata ont même
du mal à s'y retrouver car parfois les décision prises sont contradictoires
ou non coordonnées. Cela ne se rédout pas facilement et rapidement malgré
la bonne volonté de tout le monde, et parfois il y a des désaccords forts

Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Topographe Fou
Bonjour,

Tout à fait d'accord avec Yves : c'est même la raison d'être de wikidata, pas 
de remplacer wikipedia mais d'être une porte d'entrée vers les sites wikipedia, 
wikivoyages, wikinews... en plus d'être une base de données puissante, peu 
importe la langue et avec une promesse de maintenance réduite (tant qu'un 
Qx reste valide). De même que de pouvoir s'interfacer avec d'autres bdd qui 
utiliseraient cette clé publique comme osm. Ayant moi-même développé des 
moulinettes alliant wikipedia, wikidata et osm je vois bien la différence entre 
les deux clés. Et à ceux qui comme moi contribuent à Wikidata la mine 
d'information est énorme.

Donc je pense qu'il faut encourager l'usage de cette clé, de manière consciente 
(je saisie le Q) comme de manière sympathique (petit moteur de recherche 
wikidata à condition que ce soit simple de vérifier si un item correspond bien 
à ce que l'on veut, car il y a bcp d'homonymes).

Ceci étant dit il y a en effet fort à faire je pense niveau validation de tags 
wikipedia.

Et pourquoi pas lancer un maproulette pour les erreurs détectées ? D'expérience 
c'est plus lent mais permet de détecter et corriger d'autres erreurs sur le 
même objet / à proximité. Effet de bord tirant la qualité vers le haut.


LeTopographeFou


  Message original  


De: yves.prat...@gmail.com
Envoyé: 28 novembre 2019 12:29 AM
À: talk-fr@openstreetmap.org
Répondre à: talk-fr@openstreetmap.org
Objet: Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?



>> Si car ça lie directement l’objet OSM aux propriétés wikidata
>
> ils sont déjà lié, ex le plugin josm wikidata propose d'ajouter le wikidata à 
> partir de l'url wikipedia
>
Je n’étais pas assez précis : on a toutes les infos en 1 clic avec wikidata. Et 
en 2 avec wikipedia
Je suis persuadé qu’à terme il n’y aura plus que le tag wikidata.

>> Quel est l’intérêt de consommer de l’énergie à stocker et à maintenir des 
>> données redondantes ?
>
> aucun, mais rien que toi et moi on n'est pas d'accord du quel des 2 
> supprimer. alors on peux philosopher, mais sans aboutir.
D’autres peuvent apporter leur point de vue. Et tout le monde évolue (pendant 
longtemps, je ne voyais pas l’intérêt de wikidata)

> La seule piste d'amélioration possible à court terme c'est de proposer aux 
> outils qui ne le font pas encore de gérer les 2 tags
> (= fonctionner de la même manière en présence de n'importe lequel des 2)
Ça me semble un bon compromis.

La carte des objets historiques fait ça en partie.
Elle utilise https://tools.wmflabs.org/hub pour obtenir des photos à partir de 
wikipedia ou wikidata et vice-versa.

> en passant quelqu'un avait proposé un script d'intégration
> osm-wikidata (par ex ajout de name:xx). a ma connaissance
> aucun rendu ne l'a mis en place (ce serrait pratique sur les
> rendus spécialisé sur une langue précise).
> yaka mais il manque de bras :)
Je verrais bien ça pour OpenStreetMap.org… pour afficher le nom de l’élément 
wikidata et la page wikipedia dans la langue préférée de l’utilisateur…
On pourra ainsi virer le tag wikipedia 

—
Yves




___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Jérôme Amagat
>
>
>- 2669  contenant des _ à la place
>des espaces
>
> le validateur de JOSM corrige cette erreur, les _ à la place d'espace.
L'erreur est indiqué par le validateur et "réparer" remplace les _ par des
espaces.

Moi aussi je me suis fais plusieurs fois taper sur les doigts parce que
j'envoyais des données sur plusieurs continent en même temps :) , ça plaît
pas à certains qui, avec je sais plus quel outils, suivent les changset sur
leur zones et donc un changset mondial, ça bip chez tout le monde :). Mais
je pense pas qu'il y ai besoin de couper par pays, par "région" qui peut
englober plusieurs pays ça suffit.
Dans JOSM, je sélectionne un grand rectangle :) ou mieux (comme ça, ça
sélectionne les relations) une recherche "(new or modified)  inview" en ce
plaçant correctement, ne pas oublier les ( ) la dernière fois que j'ai été
interpelé, je suis allé trop vite et les ai oublié donc dans la sélection
il y avait des élements dans le monde entier :(  et après fichier -> envoyé
la sélection.
Par contre, le gros problème c'est pour les éléments supprimés, il faut pas
en avoir sinon on se retrouve avec à la fin et pas moyen de les
sélectionner :(

Pour les expression régulière et leur stockage, il est possible de les
placer dans l'espèce de wikidata du wiki d'osm, les éléments OpenStreetMap
Wiki, avec la propriété "Expression régulière pour valider la valeur" P13 (
https://wiki.openstreetmap.org/wiki/Property:P13)
Je l'ai fais il y a quelque temps ici :
https://wiki.openstreetmap.org/wiki/Item:Q1273
pour wikidata , c'est ici : https://wiki.openstreetmap.org/wiki/Item:Q827
et wikipedia là : https://wiki.openstreetmap.org/wiki/Item:Q828

Par contre, 2 remarques, l'expression régulière doit être tel que il sera
ajouté "^(" avant et ")$" après, je comprends pas pourquoi cette
restriction. Et je sais pas comment on fait une recherche dans ce wikidata
OSM, le seul moyen d'y accéder c'est par les pages "normales" et sur la
colonne de gauche "élément OpenStreetMap Wiki"
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.

>> Si car ça lie directement l’objet OSM aux propriétés wikidata
> 
> ils sont déjà lié, ex le plugin josm wikidata propose d'ajouter le wikidata à 
> partir de l'url wikipedia
> 
Je n’étais pas assez précis : on a toutes les infos en 1 clic avec wikidata. Et 
en 2 avec wikipedia
Je suis persuadé qu’à terme il n’y aura plus que le tag wikidata.

>> Quel est l’intérêt de consommer de l’énergie à stocker et à maintenir des 
>> données redondantes ?
> 
> aucun, mais rien que toi et moi on n'est pas d'accord du quel des 2 
> supprimer. alors on peux philosopher, mais sans aboutir.
D’autres peuvent apporter leur point de vue. Et tout le monde évolue (pendant 
longtemps, je ne voyais pas l’intérêt de wikidata)

> La seule piste d'amélioration possible à court terme c'est de proposer aux 
> outils qui ne le font pas encore de gérer les 2 tags
> (= fonctionner de la même manière en présence de n'importe lequel des 2)
Ça me semble un bon compromis.

La carte des objets historiques fait ça en partie.
Elle utilise https://tools.wmflabs.org/hub pour obtenir des photos à partir de 
wikipedia ou wikidata et vice-versa.

> en passant quelqu'un avait proposé un script d'intégration
> osm-wikidata (par ex ajout de name:xx). a ma connaissance
> aucun rendu ne l'a mis en place (ce serrait pratique sur les
> rendus spécialisé sur une langue précise).
> yaka mais il manque de bras :)
Je verrais bien ça pour OpenStreetMap.org… pour afficher le nom de l’élément 
wikidata et la page wikipedia dans la langue préférée de l’utilisateur…
On pourra ainsi virer le tag wikipedia 

—
Yves




___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet marc marc
Le 27.11.19 à 17:57, Yves P. a écrit :
>> mais rajouter un wikidata à qlq chose qui a un wikipedia, 
>> cela ne sert pas à grand chose.
> Si car ça lie directement l’objet OSM aux propriétés wikidata

ils sont déjà lié, ex le plugin josm wikidata propose
d'ajouter le wikidata à partir de l'url wikipedia

>>> ça fait beaucoup de données inutiles ?
>> tout a fait.
> Quel est l’intérêt de consommer de l’énergie à stocker et à maintenir des 
> données redondantes ?

aucun, mais rien que toi et moi on n'est pas d'accord du quel
des 2 supprimer. alors on peux philosopher, mais sans aboutir.
La seule piste d'amélioration possible à court terme c'est de proposer
aux outils qui ne le font pas encore de gérer les 2 tags (= fonctionner
de la même manière en présence de n'importe lequel des 2)

en passant quelqu'un avait proposé un script d'intégration
osm-wikidata (par ex ajout de name:xx). a ma connaissance
aucun rendu ne l'a mis en place (ce serrait pratique sur les
rendus spécialisé sur une langue précise).
yaka mais il manque de bras :)
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Philippe Verdy
Le mer. 27 nov. 2019 à 19:55, Yves P.  a écrit :

>
> En principe, je dis bien en principe, ces infos doivent permettre de
> contacter l'agence.
>
> Donc ici exit les contact:*
> 
>
> On va virer aussi les numéros de téléphone 
>
> *Valeur* *Quantité*
> +33 1 58 34 44 10 781
>
> Devinette : à qui appartient ce n° français ?
> Réponse (surligner) Autolib' (Paris)
>
Autolib/Vélib Métropole (Grand Paris)
https://autolibmetropole.fr/autolib-metropole/qui-sommes-nous/
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.

> En principe, je dis bien en principe, ces infos doivent permettre de 
> contacter l'agence.
> Donc ici exit les contact:* 
> 
> 
On va virer aussi les numéros de téléphone 

Valeur  Quantité
+41 31 3213111  3152
+7 800 550  3078
+7 800 2009002  1581
+7 800 505  1578
+7 495 787;+7 800 3330303   1498
+7 495 539-54-541018
+7 800 3330201  985
+7 800 2005888  821
+33 1 58 34 44 10   781
+7 495 5005550  754
+375 44 780 723
+380 44 494 0101711

Devinette : à qui appartient ce n° français ?
Réponse (surligner) Autolib' (Paris)

—
Yves___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.
> Je ne veux rien imposer, je me demande de l’intérêt d’avoir des tags « 
> dupliqués », surtout en grande quantité (décroissance c’est un sujet pour 
> certains en ce moment ).
> Au passage c’est des  brand:* pour MacDo et compagnie. Un wikidata (cf. 
> discussion plus bas) pour afficher le bon wikipédia, le logo 
> internationalisé… c’est suffisant.
Un autre exemple : https://www.openstreetmap.org/node/6699737528

brand  
100%Banco
brand:wikidata 
  
Q517093 
brand:wikipedia 

es:Banco de Venezuela
contact:facebook 
  
https://es-la.facebook.com/100x100banco/ 

contact:instagram 

https://www.instagram.com/100x100banco/?hl=es-la 

contact:twitter 

https://twitter.com/100x100banco?lang=es 

Peut-on mettre les contacts une fois pour toutes dans wikidata ?

Si non, ne peut-on pas mettre uniquement les identifiants dans contacts:* plus 
qu’une longue URL ?
Note: c’est le cas pour twitter, instagram, pas facebook.

Mais en pratique, seuls les URL ont des liens dans OSM, Overpass… donc les 
contributeurs mettent des URL 拾

contact:facebook51 591
facebook18 085
website:facebook116

Voici uniquement la première page de taginfo :
contact:facebook

contact:instagram   
https://www.facebook.com/ruspost2784
https://instagram.com/sberbank  1135
https://www.facebook.com/pyaterochka1674
https://www.instagram.com/sberbank/ 742
https://www.facebook.com/sberbank   1657
https://www.instagram.com/mol.magyarorszag/ 444
https://www.facebook.com/vtbgroup   716 
https://www.instagram.com/ruspostofficial   440
https://www.facebook.com/krasnoe.beloe  566 
https://www.instagram.com/krasnoebeloe  342
https://www.facebook.com/mol.magyarorszag/  444 
http://instagram.com/perekrestok325
https://www.facebook.com/perekrestok426 
https://www.instagram.com/izbenka_vkusvill  240
https://www.facebook.com/bankdruzey 418 
https://www.instagram.com/mcdonalds_rus/229
https://www.facebook.com/mcdonaldsrussia300 
https://www.instagram.com/bankvtb   204
https://www.facebook.com/izbenka294 
https://www.instagram.com/sberbank  198
https://www.facebook.com/mts269 
https://www.instagram.com/orteka_rus/   197
https://www.facebook.com/orteka.rus 198 
https://instagram.com/krasnoebeloe  156

9746

4652
Il y a 31222 clé contact:facebook avec une URL et 15395 pour la clé facebook 拾

> Quel est l’intérêt de consommer de l’énergie à stocker et à maintenir des 
> données redondantes ?
J’ai oublié la bande passante pour télécharger ça 

—
Yves___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.
> les CLEFS et les VALEURS sont 2 choses qu'il faut séparer :
> 
> corriger les VALEURS erronées : je suis 100% pour.
C’est l’objet de ces méls

> mais choisir quel CLEF le monde entier doit ou pas utiliser,
> ce n'est pas le bon endroit
Je ne veux rien imposer, je me demande de l’intérêt d’avoir des tags « 
dupliqués », surtout en grande quantité (décroissance c’est un sujet pour 
certains en ce moment ).
Au passage c’est des  brand:* pour MacDo et compagnie. Un wikidata (cf. 
discussion plus bas) pour afficher le bon wikipédia, le logo internationalisé… 
c’est suffisant.

> et je doute même que tu arrives
> à un accord unanime nécessaire aux éditions de masse
L’idée n’est pas forcément de faire une édition de masse, mais de réfléchir à 
nos pratiques, à l’intérêt final, au coût que ça à sur la maintenance…

> 2 exemples :
> 
> 1) les tags _1 _2 _3 : je suis totalement contre, c'est une décision
> controversée d'iD de créer un 2ieme tag avec _1 lors que l'utilisateur
> veux rajouter une 2ieme fois le même tag.
Zut, iD fait encore ça (je pensais que c’était une ancienne pratique)

> lors que les 2 tags ont la même info (comme l'exemple que tu as donné
> avec wikipedia=valeurnormale + wikipedia_1=url), c'est automatisable.
oui

> mais lorsque ce n'est pas le cas, c'est impossible d’automatiser.
Si c’est ce que font les règles dans JOSM : elles demandent à l’humain derrière 
le clavier de gérer 
Ou alors elles sont plus subtiles, ce que semble faire le greffon wikipedia de 
JOSM.
Du style, j’ai wikipedia:fr=* et pas de wikipedia=*, je change le tag en 
wikipedia=fr:*
J’ai wikipedia_1=fr:* wikipedia_2=de:* …, si je peux, je change les tags en 
wikipedia=fr:* wikipedia:de=* …
C’est ce que je fais manuellement. C’est l contributeur local qui décidera de 
ce qui est approprié.

> faire une édition de masse mondiale qui les vire va être à juste titre
> contestée s'il n'y a pas une discussion mondiale avant sur la ml talk.
Ok, quand on arrivera à un consensus francophone, je laisserai les spécialistes 
s’en occuper 
(Ou alors je prendrais le temps de suivre cette liste. La notre est déjà très 
énergivore )

> 2) wikidata <> wikipedia : la logique osm est d'avoir des tags lisible
> pour les humains, par conséquent s'il ne doit y en avoir qu'un, c'est
> wikipedia.
Pour le moment .

Sur le tableau que j’ai fait passé, on voit que iD et JOSM (avec le greffon 
wikipedia) affichent en clair et dans ta langue, le nom de l’élément wikidata.
iD permet même une saisie à la volée.

Il ne manque que l’affichage dans OSM et overpass… pour régler la question.
Je pense que c’est juste un bout de javascript à rajouter pour faire ça.

 (Note: Le tableau semble bloqué pour une question de taille)

> indpendament de cela, certains ont eu besoin d'un tag wikidata pour lier
> différente base de donnée entre elle au lieu d'innoncer osm avec plein
> de ref:a ref:b
Zut, c’est ce que je fais 
La question est subtile, on en avait déjà discuté dans le passé :
Avoir des identifiants dans OSM permet une certaine indépendance vis à vis de 
wikimedia, et des choses impossible à faire avec nos outils actuels.
Je cherche tous les phares avec un identifiant de la NGA n’est pas possible en 
l’état avec overpass.

> mais rajouter un wikidata à qlq chose qui a un wikipedia, cela ne sert
> pas à grand chose.
Si car ça lie directement l’objet OSM aux propriétés wikidata (les wikis, les 
propriétés non géographiques qui ne sont pas dans OSM…)
A terme, il n’y aura plus de wikipedia:*=*  (cf. supra)

> et supprimer le wikipedia à un élément qui a un
> wikidata, c'est illogique (il ne reste plus qu'un chiffre
> au lieu d'avoir un tag lisible pour les humains)
Idem.

> 
>> ça fait beaucoup de données inutiles ?
> 
> tout a fait.
Quel est l’intérêt de consommer de l’énergie à stocker et à maintenir des 
données redondantes ?
Je parle d’huile de coude (sujet à la tendinite en ce moment à force de cliquer 
), mais il est aussi possible de voir les centrales à charbon  et à uranium 
☢️ au bout de la fibre optique 

> Vespucci a par exemple décider de ne plus ajouter les
> wikidata venant du nsi, il ajoute uniquement les wikipedia
C’est une solution que peu choisir la(es) communauté(s), en tout cas ça me 
parait important d’y penser.

—
Yves
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet marc marc
Le 27.11.19 à 15:16, Yves P. a écrit :
> Mais est-ce pertinent de saisir des brand:wikipedia alors que la
> combinaison brand=* et brand:wikidata=* est peut-être suffisante ?

les CLEFS et les VALEURS sont 2 choses qu'il faut séparer :

corriger les VALEURS erronées : je suis 100% pour.
mais choisir quel CLEF le monde entier doit ou pas utiliser,
ce n'est pas le bon endroit et je doute même que tu arrives
à un accord unanime nécessaire aux éditions de masse

2 exemples :

1) les tags _1 _2 _3 : je suis totalement contre, c'est une décision
controversée d'iD de créer un 2ieme tag avec _1 lors que l'utilisateur
veux rajouter une 2ieme fois le même tag.
lors que les 2 tags ont la même info (comme l'exemple que tu as donné
avec wikipedia=valeurnormale + wikipedia_1=url), c'est automatisable.
mais lorsque ce n'est pas le cas, c'est impossible d'automatiser.
faire une édition de masse mondiale qui les vire va être à juste titre
contestée s'il n'y a pas une discussion mondiale avant sur la ml talk.

2) wikidata <> wikipedia : la logique osm est d'avoir des tags lisible
pour les humains, par conséquent s'il ne doit y en avoir qu'un, c'est
wikipedia.
indpendament de cela, certains ont eu besoin d'un tag wikidata pour lier
différente base de donnée entre elle au lieu d'innoncer osm avec plein
de ref:a ref:b
mais rajouter un wikidata à qlq chose qui a un wikipedia, cela ne sert
pas à grand chose. et supprimer le wikipedia à un élément qui a un
wikidata, c'est illogique (il ne reste plus qu'un chiffre
au lieu d'avoir un tag lisible pour les humains)

> ça fait beaucoup de données inutiles ?

tout a fait. Vespucci a par exemple décider de ne plus ajouter les
wikidata venant du nsi, il ajoute uniquement les wikipedia
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.
@Stéphane
> J'ai croisé des cas semblables récemment, avec des transformation d'un tag 
> brand:wikipedia=fr:Système U
> 
> Je ne suis pas certains que ça soit très pertinent comme modif.
> 
Il n’y en que 2  : 1 en Espagne, l’autre au 
Portugal.
La page web anglaise existe bien (pas les pages en espagnol et en portugais).

Mais est-ce pertinent de saisir des brand:wikipedia alors que la combinaison 
brand=* et brand:wikidata=* est peut-être suffisante ?
Pour le moment, OSM n’affiche pas le nom en clair pour les wikidata.
Il faut donc cliquer sur le lien pour en savoir plus. Mais est-ce vraiment un 
problème ?

—
Yves

PS: pour tous les brand=*, brand:wikidata=*, brand:wikipedia=*, 
brand:wikipedia:en=*… redondant, ça fait beaucoup de données inutiles ?
environ 756000 brand=*, 475000 brand:wikidata et brand:wikipedia (cf. 
https://taginfo.openstreetmap.org/search?q=brand)

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.
@marc
>> Comment repérer les valeurs et/ou les clés erronées ?
> 
> cela dépend de ce que tu veux en faire.
> pour une édition de masse, le mieux est probablement de télécharger un
> extrait France, de filtrer pour ne garder que les objets avec une clef
> wikipedia et de tavailler dessus
Il n’y a pas forcément de grande quantité (quoi que avec toutes les sous clés)…
Mais un peu partout sur le globe… C’est très lourd à téléverser sur le serveur 
pays par pays.

Le plus simple serait d’avoir la bonne requête overpass et les corrections 
faites dans JOSM ou ses greffons.
Pour la requête, tout n’est pas faisable (cf. #146 
 faite il y a 5 ans déjà).
Pour rechercher les clés de la même façon avec taginfo, même problème (cf. #271 
)

> pour améliorer la qualité des futures données, il est utile de faire les 
> tickets/PR dans les éditeurs et osmose
Vous pouvez étayer les tickets existants 
Pour osmose, je sais qu’il fait des contrôle et des corrections. Pouvez-vous 
regarder de plus près ?

>> Faut-il les nettoyer ?
> 
> si cela te motive de proposer, n'hésites pas
Il y a des requêtes dans ma réponse à Jean-Yvon. L’intérêt de le faire à la 
main est de comprendre comment un contributeur arrive à faire ça.
Ça permettra de proposer des tickets et des correctifs plus adaptés et 
efficaces.

>> Si oui, comment ?
>>  * contrôles et corrections automatiques dans l’éditeur
> 
> à mon avis les 3
> - un contrôle à la source est toujours mieux que de corriger après.
Oui et comme le précise Jean-Yvon, ça évitera que ça se reproduise.

> pour éviter l'indigestion, je pense que tu devrais cibler
> un cas à la fois : par exemple les valeurs génériques
> ou les typo qu'il est possible parfois de corriger
> automatiquement à partir du wikidata
> ou n'importe quel autre cas qui te branche pour commencer :)
J’ai essayé de ne montrer que quelques exemples pour monter l’ampleur du bazar. 
Il y en a probablement pleins d’autres.
Je les ai mis en post-scriptum, j’aurais du rajouter un TL/DR 


J’ai aussi fait un tableau « synthétique » des contrôle des les éditeurs (mais 
le mél ne passe pas).

>> wikipedia=fr:Phare
> 
> introuvable même en utilisant overpass pour remonter au 1er janvier
> tu as un exemple ?
c’était un exemple avec un mot au pif.
ici, modification faite volontairement avec iD : 
https://www.openstreetmap.org/node/331257382/history

Il y en avait 260 le 15 novembre : https://overpass-turbo.eu/s/OvN

> a noter un cas fréquent en France : la mise du tag sur tous les rails d'une 
> relation train
> 
Je suis tombé sur celle-là : https://www.openstreetmap.org/relation/6051577
rien sur la relation, tout sur les chemins : donc à nettoyer

Mais ça ne se cantonne pas à la France : 
https://taginfo.openstreetmap.org/keys/wikipedia?filter=ways#values
Si tu regardes les valeurs qui ont 3 ou plus de chemins, ça fait 1 clés 
wikipedia !
La ligne Shinkansen Tōkaidō  
fait 514 km. Elle a 2239 membres sous OSM !!
Tous? les segments semblent avoir tous les tags dupliqués : 
https://www.openstreetmap.org/way/609446768

> heu... ben du coup on discute de quoi ?
De comment éviter que ça revienne.
Nettoyer c’est bien, mais le faire façon tonneau des Danaïdes 
, c’est un vrai châtiment. 

> je pensais que tu voulais discuter s'il fallait ou pas
> faire des opérations de masse
Aussi, car il y a tous? les pays, et tous les sous tags wikipedias 

>>  * subject:wikipedia:en
> 
> qu'est-ce qui n'est pas juste ?
C’est peut-être redondant avec subject:wikipedia=ru:*. subject:wikidata=Qxxx 
est peut-être largement suffisant et produit moins de maintenance.
Aucun des outils suivant n’affiche de lien (OpenStreetMap, overpass-turbo, iD, 
JOSM)
Quand a subject:wikidata, il ne manque que pour iD.

> 
>> Tags d'éléments « supprimés » Faut-il les supprimer ?
> cela n'a pas grand intérêt
De les garder, c’est bien ça ?

—
Yves___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Stéphane Péneau

Le 27/11/2019 à 13:53, Yves P. a écrit :


wikipedia=gl:https://upload.wikimedia.org/wikipedia/commons/6/6a/Plano_de_Moaña.png 
(*version 1* du noeud 6703264890 
)
Le préfixe GL (galégo) provient d’une contribution récente sous iD par 
un « débutant » (94 contributions depuis 1 an).
Sous iD, si on colle une URL dans le formulaire wikipedia, la langue 
est saisie par défaut (le contributeur parle le galicien).




J'ai croisé des cas semblables récemment, avec des transformation d'un tag

brand:wikipedia=fr:Système U

en

brand:wikipedia=en:Système U


Je ne suis pas certains que ça soit très pertinent comme modif.

Stf

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet Yves P.
@Jean-Yvon
> Philippe, la réponse d'Yves est bonne car il ne parlait "que" des tags 
> wikipedia.
> 
Je confirme. Le sujet est déjà assez vaste et chiant comme ça 
> Tu veux généraliser, ce n'est pas une mauvaise idée, tu proposes une base 
> réutilisable par les différents éditeurs ?
> 
J’ai fait un ticket (cf. infra) suggérant que le code du greffon wikipedia 
utilise déjà l’API wikimedia pour avoir une liste à jour.
Par défaut, le « contrôleur » (validator) de JOSM ne teste pas tout (en ne pas 
pas tout tester).
Le greffon wikipedia va plus loin, mais les 2 ne testent pas tous les cas, ils 
sont en partie redondant et parfois donnent des résultats différent.

Du coup, ça complique le travail de maintenance des données 

J’ai creusé un peu plus ce matin.

wikipedia=gl:https://upload.wikimedia.org/wikipedia/commons/6/6a/Plano_de_Moaña.png
 (version 1 du noeud 6703264890 
)
Le préfixe GL (galégo) provient d’une contribution récente sous iD par un « 
débutant » (94 contributions depuis 1 an).
Sous iD, si on colle une URL dans le formulaire wikipedia, la langue est saisie 
par défaut (le contributeur parle le galicien).

iD ne fait pas de contrôle sur le contenu du champ wikipedia… encore moins de 
transformation en File:Plano_de_Moaña.png

Le contrôleur par défaut de JOSM détecte un problème, mais ne le corrige pas. 
Le greffon ne voit rien.

> Le 26/11/2019 à 22:53, Yves P. - yves.prat...@gmail.com 
>  a écrit :
> 
>> Faut-il les nettoyer ?
>> gros travail…
>> la clé wikidata permet de gérer les libellés en plusieurs langues, les 
>> synonymes, les relations entre objets, les identifiants externes…
> Oui si possible
Pour la clé wikipedia, il ne reste «  que » :
61  URL
15  fichiers wikimedia commons
1  préfixe tronqué (e: au lieu de en:)
1  préfixe wiki:
1  préfixe language:
478  objets ans préfixe (au minimum)
78  encodées (contenant %XX)
2669  contenant des _ à la place des espaces
? combien avec des pages redirigées ou inexistantes ?

Et il y a toutes les autres sous clés wikipedia à vérifier 浪

>> Il y a en avait beaucoup, c’est presque tout nettoyé. Est-ce que ça 
>> reviendra avec l’arrivée de contributeurs débutants ?
> Oui
> 
Je pense aussi.
Nous devons donc analyser ces erreurs pour fait des contrôles plus adaptés dans 
iD, JOSM… (et ou corriger des bugs).

>> Tags d'éléments « supprimés »
>> Faut-il les supprimer ?
> Ça dépend des cas. Globalement ça ne mange pas de pain et si des gens ont 
> jugé utile de les ajouter.
> 
Il y a peut-être l’historique pour ça.
Mettre old_name et was:amernity=xxx et peut être suffisant ?

Je ne savais pas encore récemment, mais il est possible de faire des requêtes 
overpass dans le passé. 
> former_operator:wikipedia
> former:operator:wikipedia
> Je ne vois pas trop l'utilité et il faudrait a minima passer à un préfixe de 
> cycle de vie (was: ?)
> 
Pour moi, à virer comme plus haut.
L’idée de mettre ca-nexiste-plus:amenity=* est plutôt bonne (c’est une forme de 
cycle de vie), mais au final ça « pollue »  la base.
Autant le garder pour le nom et l’objet principal, autant le virer pour les 
tags *:wikipedia:*

> old_name:wikipedia
> old_wikipedia
> old_wikipedia:zh
> old:wikipedia
> J'ai du mal à comprendre. Si on a un ancien nom, dans l'article Wikipédia 
> actuel il y sera fait référence et la page Wikipédia correspondante sera 
> citée.
> 
Du coup, pas d’intérêt à garder ça ?
> not:brand:wikipedia
> 
> Ça c'est utile pour éviter que des cartographes en fauteuil ne disent que le 
> restaurant McDonald est une franchise McDonald alors qu'il a juste le malheur 
> de partager son nom.
> 
ok pour garder not:brand=*
voir not:band:wikidata=* (overpass et le site web d’osm affichent les liens)
ça ne fait que 5  cas
> Virer/corriger les valeurs incorrectes me semble plus utile. Par exemple en 
> transformant ta revue des manques de vérification en tickets JOSM/iD…
> 
2 ici pour JOSM : 
https://josm.openstreetmap.de/ticket/18360
https://josm.openstreetmap.de/ticket/18256#comment:8 (c’est pas l’objet 
principal du ticket)

En fait il y a une multitude de chose à faire, ou à revoir. Il faut peut-être 
prendre du recul sur la façon de saisir et/ou de contrôler les données ?
Les validateurs de JOSM sont très bruyants, avec parfois des messages « 
ésotériques ».
Ils ne proposent pas toujours de nettoyage automatique.

Par exemple, saisir une article wikipedia, un élément wikidata ou une photo 
wikimedia commons… est peut-être plus facile pour les contributeurs en faisant 
un simple copier/coller de l’URL.

Si c’est vraiment le cas, il faut nettoyer ça à la saisie, ou simplifier le 
processus 

Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet marc marc
Bonjour,

Le 26.11.19 à 22:53, Yves P. a écrit :
> Comment repérer les valeurs et/ou les clés erronées ?

cela dépend de ce que tu veux en faire.
pour une édition de masse, le mieux est probablement de télécharger un
extrait France, de filtrer pour ne garder que les objets avec une clef
wikipedia et de tavailler dessus

pour améliorer la qualité des futures données, il est utile
de faire les tickets/PR dans les éditeurs et osmose

> Faut-il les nettoyer ?

si cela te motive de proposer, n'hésites pas

> Si oui, comment ?
>   * contrôles et corrections automatiques dans l’éditeur

à mon avis les 3
- un contrôle à la source est toujours mieux que de corriger après.
- vu l'ampleur que tu décris, une/des éditions en France
semble le plus approprié
- après, proposer le correctif mondial et/ou le correctif dans les éditeurs

> PS: Quelques exemples :

pour éviter l'indigestion, je pense que tu devrais cibler
un cas à la fois : par exemple les valeurs génériques
ou les typo qu'il est possible parfois de corriger
automatiquement à partir du wikidata
ou n'importe quel autre cas qui te branche pour commencer :)

> wikipedia=fr:Phare

introuvable même en utilisant overpass pour remonter au 1er janvier
tu as un exemple ?

a noter un cas fréquent en France : la mise du tag sur tous les rails
d'une relation train
https://taginfo.openstreetmap.fr/keys/wikipedia#values

> c’est presque tout nettoyé

heu... ben du coup on discute de quoi ?
je pensais que tu voulais discuter s'il fallait ou pas
faire des opérations de masse

> Suffixes de langue inappropriés :
>   * subject:wikipedia:en

qu'est-ce qui n'est pas juste ?

> Tags d'éléments « supprimés »
>   * abandoned:wikipedia
> Faut-il les supprimer ?

cela n'a pas grand intérêt

Cordialement,
Marc
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-27 Par sujet osm . sanspourriel

Philippe, la réponse d'Yves est bonne car il ne parlait "que" des tags
wikipedia.

Tu veux généraliser, ce n'est pas une mauvaise idée, tu proposes une
base réutilisable par les différents éditeurs ?


Le 26/11/2019 à 22:53, Yves P. - yves.prat...@gmail.com a écrit :

Faut-il les nettoyer ?

  * gros travail…
  * la clé wikidata permet de gérer les libellés en plusieurs langues,
les synonymes, les relations entre objets, les identifiants externes…


Oui si possible

Il y a en avait beaucoup, c’est presque tout nettoyé. Est-ce que ça
reviendra avec l’arrivée de contributeurs débutants ?


Oui


Tags d'éléments « supprimés »

  * abandoned:brand:wikipedia
  * abandoned:wikipedia
  * demolished:brand:wikipedia
  * demolished:wikipedia
  * former_operator:wikipedia
  * former:operator:wikipedia
  * not:brand:wikipedia
  * old_brand:wikipedia
  * old_name:wikipedia
  * old_wikipedia
  * old_wikipedia:zh
  * old:wikipedia
  * razed:wikipedia
  * was:brand:wikipedia
  * was:operator:wikipedia
  * was:wikipedia


Faut-il les supprimer ?


Ça dépend des cas. Globalement ça ne mange pas de pain et si des gens
ont jugé utile de les ajouter.

 * former_operator:wikipedia
 * former:operator:wikipedia

Je ne vois pas trop l'utilité et il faudrait a minima passer à un
préfixe de cycle de vie (was: ?)

 * old_name:wikipedia
 * old_wikipedia
 * old_wikipedia:zh
 * old:wikipedia

J'ai du mal à comprendre. Si on a un ancien nom, dans l'article
Wikipédia actuel il y sera fait référence et la page Wikipédia
correspondante sera citée.

not:brand:wikipedia

Ça c'est utile pour éviter que des cartographes en fauteuil ne disent
que le restaurant McDonald est une franchise McDonald alors qu'il a
juste le malheur de partager son nom.

Virer/corriger les valeurs incorrectes me semble plus utile. Par exemple
en transformant ta revue des manques de vérification en tickets JOSM/iD...

Jean-Yvon

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Philippe Verdy
Non, OSM a des données aussi pour bien autre chose que les liens Wikimedia,
notamment pour les libellés (name:* et variantes) qui sont en de bien plus
nombreuses langues (et écritures).

Pour les liens wikipedia, il n'y a pas besoin de la conformité BCP 47 car
oui dans ce cas ce ne sont que des étiquettes de noms de domaines.
Cependant dans les deux cas la casse n'est pas imposée, il y a juste une
casse recommandée et qu'on peut normaliser en minuscules (même si pour
BCP47 il est fait référence à des casses alternatives concernant les codes
ISO 3166-1 (à 2 lettres uniquement, éventuellement augmenté par des codes
de subdivisions de l'ISO 3166-2, avec un séparateur facultatif, donc lui
aussi ce second sous-code devrait être en capitales, mais ce cas ne
concerne pas les codes de langues régionalisés qui n'utilisent pas du tout
les codes ISO 3166-2) normalement en capitales uniquement, et les codes ISO
15924 avec l'initiale seule en capitale.

Pour OSM, tout ce qui concerne la codification des langues de base devrait
être en minuscules (mais les extensions de code peuvent varier en casse, et
on ne doit pas supprimer les séparateurs, et OSM devrait normaliser partout
les capitales requises pour les codes régions et l'initiale seulement des
codes d'écriture, sinon tout le reste en minuscules uniquement: on a des
tags dont les noms qui ont des extensions, préfixées ou suffixées avec ":"
qui dinstingue soit par pays, soit par langue; et aussi des extensions ":"
d'usage privé qui devraient être en minuscules mais d'autres en capitales
et on a le risque de collision avec des codes langue ou codes
géographiques, et c'est un peu le "bordel" dans ces extensions qui
devraient éviter tout risque de collision avec les codes langues ou
géographiques, en normalisant ces dernières de la façon recommandée par
BCP47, afin que les autres extension OSM n'utilisent aucune de ces formes;
cependant il n'y a pas de collision si les extensions OSM ne sont PAS 2 ou
3 lettres ou 3 chiffres éventuellement suivis d'un trait d'union et là on a
un peu toutes les formes; mais il y a encore certaines extensions privées
d'OSM qui entrent en collision avec les codes langues et géographiques avec
leur capitalisation normalisée : OSM initialement a émis des
recommandations n'utilisant que les minuscules mais ce n'est pas tenable et
les tags privées d'OSM ont une casse significative par défaut: on doit donc
normaliser la casse de ces codes même si ni BCP 47 ni les codes ISO, ni les
noms de domaines Wikimedia ne l'imposent, et ça traîne depuis des années et
continue à compliquer les requêtes et à poser des problèmes d'évolution
pour plus de langues ou de régions).


Le mer. 27 nov. 2019 à 00:36, Yves P.  a écrit :

>
> Concernant les préfixes de langue il n'y a pas que les tirets, mais si on
> les accepte il faudrait aussi valider la syntaxe. Visiblement ne sont
> acceptés que les codes langue en minuscules
>
> En fait c’est plus simple, on n’accepte que les codes de langues des sites
> wikipedia existants.
> cf. API wikimedia ou requêtes SPARQL : https://w.wiki/Cqb
>
> Minuscules ou majuscules, ce sont des noms de domaines, donc (pour le
> moment) ça ne change rien.
>
> —
> Yves
>
>
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Yves P.

> Concernant les préfixes de langue il n'y a pas que les tirets, mais si on les 
> accepte il faudrait aussi valider la syntaxe. Visiblement ne sont acceptés 
> que les codes langue en minuscules
En fait c’est plus simple, on n’accepte que les codes de langues des sites 
wikipedia existants.
cf. API wikimedia ou requêtes SPARQL : https://w.wiki/Cqb

Minuscules ou majuscules, ce sont des noms de domaines, donc (pour le moment) 
ça ne change rien.

—
Yves

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Philippe Verdy
Le mar. 26 nov. 2019 à 23:28, Yves P.  a écrit :

>Notes
>
>1
https://trac.openstreetmap.org/browser/subversion/applications/editors/josm/plugins/tag2link/resources/tag2link_sources.xml#L59
>\p{Lower} dans l’expression rationnelle n’accepte pas le tiret ? Remplacer
par [a-z-] ou [a-zA-Z-]
>
>2 https://github.com/tyrasd/overpass-turbo/blob/master/js/overpass.js#L719
>[a-zA-Z] dans l’expression rationnelle n’accepte pas le tiret. Remplacer
par [a-zA-Z-]

Concernant les préfixes de langue il n'y a pas que les tirets, mais si on
les accepte il faudrait aussi valider la syntaxe. Visiblement ne sont
acceptés que les codes langue en minuscules (même accentuées ou non
latines, ce qui est incorrect). Mais aussi sans limite de longueur. De plus
après les tirets, on peut avoir un code de variante de langue (obsolète, de
3 lettres minuscules), un code d'écriture (1 majuscule et 3 minuscules), un
code région (2 lettres pour un code ISO 3166-1 ou 3 chiffres), et de code
de variante (en minuscules ou chiffres ASCII). Et tous les "subtags" sont
limités à 8 caractères et ont au moins 2 caractères (entre les tirets); les
sub
tags à 1 lettre sont spéciaux et ne devraient pas être utilisés pour
identifier les langues (les anciens codes IANA commençant par "i-" sont
obsolètes, et les codes langues "x-*" sont bannis hors des "subtags" de
variantes régionales (préférables aux codes de régions ISO 3166-1 qui ne
sont pas assez discernants), mais des propriétés de localisation.

Bref une expression régulière correcte serait

[a-z][a-z][a-z]?(-[a-z][a-z][a-z])?(-[A-Z][a-z][a-z][a-z])?(-[A-Z][A-Z]|[0-9][0-9][0-9])?(-x)?(-[a-z]{2,8}):

Si on est strict, mais on peut admettre alors aussi ces préfixes en
capitalisation différente (quitte à les normaliser ensuite automatiquement,
y compris en remplaçant les séparateurs "_" par des "-"), conformément à ce
que prévoit le standard BCP47. Ensuite chaque "subtag" peut éventuellement
être validé si on a une copie locale de la base IANA pour BCP47 (sauf cas
spécial des variantes "-x-[a-z0-9]{2,8}" qui elles sont validées par un
dictionnaire de variantes privées admises dans OSM (mais sont sujette à
remplacement automatisable ultérieurement s'il y a un code standard tel que
"be-x-tarask" reconverti en "be-tarask", avant la suppression de ces
admissions du dictionnaire quand la base OSM a été nettoyée et les
utilisateurs avertis)

Ceci dit la validation peut admettre des codes devenus depuis ambigus et
dépréciés mais qu'on ne peut pas remplacer automatiquement: c'est le cas
quand ISO a scindé un code langue en deux.

Il reste enfin des exceptions venant de Wikimedia (telles que "roa-tara"
qui devraient être plutôt une variante du sicilien "scn-tara" ou une
variante non standard de l'italien "it-x-tara")

D'autres substitutions automatiques sont possibles (exemple changer "fre"
ou "fra" en "fr", si on préfère les codes courts ISO 639-1 aux codes ISO
639-2/3).

Dans l'état, les validateurs sont peu à jour et sont encore basés sur la
vieille version de BCP 47 non basée sur RFC 4646 mais sur une version plus
ancienne. Il serait temsp de convertir tou ça car les RFC 47 a quand mêem
été mise à jour depuis plusieurs années, avant même la sortie de l'ISO
639-3 et les révisions de l'ISO 15924 pour les codes d'écritures et la
refonte du registre IANA avec des règles bien plus précises et une
politique de stabilité et une procédure établie pour les
ajouts/révisions/dépréciations, ainsi que la révision des codes à remplacer
automatiquement !

Quand à la normalisation des codes (la capitalisation) je n'ai pas d'avis
tranché, on peut très bien admettre dans OSM uniquement les formes
minuscules seulement, sans capitaliser la première lettre des codes
d'écriture ou les codes région ISO 3166-1 à deux lettres. En revanche on
doit éviter les formes ISO 3166 ou ISO15924 en chiffres, on peut les
subtituer automatiquement (et leur liste n'est pas longue, il ne doit
rester que quelques codes à 3 chiffres pour les groupes de pays par masse
continentale). Mais ce la ne devrait pas bloquer la validation des données
si un éditeur omet cette substitution automatique. car un bot peut
facilement faire la correction plus tard.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Yves P.
Redirections gérées par les principales applications.

Contrôle
valeur
url
iD
tag2link
Openstreetmap
Overpass
wikipedia






avec préfixe de langue
fr:Œting
https://fr.wikipedia.org/wiki/Œting   
oui
oui
oui
oui
simple:Hatshepsut
https://simple.wikipedia.org/wiki/Hatshepsut 
 
oui
oui
oui
oui
nds:Seppenser Möhl
https://nds.wikipedia.org/wiki/Seppenser_Möhl 
  
oui
oui
oui
oui
es:Óscar Quiñones
https://es.wikipedia.org/wiki/Óscar_Quiñones 
   
oui
oui
oui
oui
be-tarask:Новы Двор
https://be-tarask.wikipedia.org/wiki/Новы_Двор 

 
⚠️ oui
oui
oui
non (2)
be-x-old:Серкавіцкі сельсавет
https://be-tarask.wikipedia.org/wiki/Серкавіцкі_сельсавет 


oui
oui
oui
fiu-vro:Põrmujärv
https://fiu-vro.wikipedia.org/wiki/Põrmujärv 
   
oui
oui
oui
sans préfixe
Paris
 ⚠️ pointe sur le site anglais
non
(comportement adapté )
龍潭大池
Париж
URL
https://en.wikipedia.org/wiki/Paris    

page de recherche 


⚠️ plante    
oui
oui

http://undar.edu.pe/  

oui
oui
wikipedia:*






wikipedia:fr
Île des Sœurs
https://fr.wikipedia.org/wiki/Île_des_Sœurs 
 
⚠️ non
oui
oui
oui
wikipedia:es
Alcocéber
https://es.wikipedia.org/wiki/Alcocéber 
  
oui
oui
oui
wikipedia:gag
Komrat
https://gag.wikipedia.org/wiki/Komrat    
oui
oui
oui
wikipedia:be-tarask
Межава (Аршанскі раён)
https://be-tarask.wikipedia.org/wiki/Межава_(Аршанскі_раён) 

 
non (1)
oui
oui
wikipedia:zh-yue
河北沿海高速公路
https://zh-yue.wikipedia.org/wiki/河北沿海高速公路 

 
oui
oui
wikidata






Liens multiples
Q22949674;Q22949654


⚠️ oui (3)
non
non
Notes






1
https://trac.openstreetmap.org/browser/subversion/applications/editors/josm/plugins/tag2link/resources/tag2link_sources.xml#L59
 


\p{Lower} dans l’expression rationnelle n’accepte pas le tiret ? Remplacer par 
[a-z-] ou [a-zA-Z-]
2
https://github.com/tyrasd/overpass-turbo/blob/master/js/overpass.js#L719 


[a-zA-Z] dans l’expression rationnelle n’accepte pas le tiret. Remplacer par 
[a-zA-Z-]
3
Produit un seul lien avec les 2 valeurs. Le site wikidata indique que cette 
entité n’existe pas.___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Yves P.
Tableau des contrôles effectués par les éditeurs (non exhaustif)

Il y a des applications sur smartphone à rajouter éventuellement, les outils de 
contrôle qualité : osmose…

Les contrôles effectués sont probablement à compléter…

_
Yves


Contrôle
Exemple
iD
JOSM



validator
(wikipedia.mapcss 
)
greffon
Wikipedia
wikipedia
vérification du préfixe « langue »
dummy:Paris
non
incomplet
liste statique (2)
oui
utilise l’API de mediawiki (3)
vérification absence du préfixe
Paris
non
oui
oui
remplacement URL complète
https://en.wikipedia.org/wiki/Paris    
non
non
oui
remplacement caractères encodés
P%C3%B5rmuj%C3%A4rv
non
oui
non
remplacement caractères soulignés
nl:Gymnasium_Haganum
non
oui
oui (1)
vérification des redirections
fr:Manjaque redirect
non
non
oui
vérification wikipedia sans correspondance wikidata

non
non
oui
vérification article inexistant

non
non
non
vérification URL non wiki
http://undar.edu.pe/  

oui (4)
oui (5)

vérification valeurs multiples
en:Izadshahr, fa:ایزدشهر
non (6)
wikipedia:*
vérification du suffixe « langue » dans la clé
wikipedia:dummy
non
non
non
vérification des valeurs
(comme pour la clé wikipedia)

non
non
non

vérification caractères encodés
P%C3%B5rmuj%C3%A4rv
non
oui
non

remplacement caractères soulignés
Gymnasium_Haganum
non
non
non
*:wikipedia
vérification du préfixe dans la clé

non
non
non
vérification des valeurs
(comme pour la clé wikipedia)

non
non
non
wikidata
vérification élément inexistant

non

oui

vérification valeurs multiples
Q22949674;Q22949654

oui
oui (7)
wikidata
Affichage articles sur la carte

non

oui
wikipedia
wikidata
saisie interactive

oui

non
wikipedia
Notes





1
messages peu clairs :
[Wiki] Wikidata item and Wikipedia article do not match! - Wikidata item 
Q367203 is not associated with Wikipedia article nl:Gymnasium_Haganum (has no 
Q-ID) (1) 
[Wiki] Wikipedia article is a redirect - Wikipedia article 'Gymnasium_Haganum' 
redirects to 'Gymnasium Haganum' (1) 
2
https://josm.openstreetmap.de/browser/josm/trunk/data/validator/wikipedia.mapcss#L13
 

3
https://gitlab.com/JOSM/plugin/wikipedia/blob/master/src/main/java/org/wikipedia/validator/WikipediaValueFormat.java#L97
 

https://www.wikidata.org/w/api.php?action=help=sitematrix 

4
message peu clair :
attributs dépréciés - Le format du tag wikipedia est obsolète, utilisez 
'wikipedia'='langue:page de titre' à  la place (1) 
5
message clair ?
[Wiki] Unknown Wikipedia language prefix 'http'! (1) 
6
valeurs multiples non gérées. La page wikipedia inique que l’article n’existe 
pas.
7
valeurs multiples non gérées pour les vérifications (détecte une valeur 
erronée). Mais le nom de l’élément Q123 est affiché automatiquement___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] Vérification des tags wikipedia et nettoyage ?

2019-11-26 Par sujet Yves P.
Bonsoir,

En regardant de plus près les clés wikipedia et leurs valeurs avec taginfo, je 
constate pas mal de bazar.

Lors de la saisie, que vérifient (ou pas) les principaux éditeurs ?
(J’ai fait un tableau comparatif. Il sera envoyé plus tard)

Pour les données existantes,

Comment repérer les valeurs et/ou les clés erronées ?
taginfo
difficile car pas de recherche par expressions rationnelles (regex)
export des valeurs + script utilisant des regex
requêtes overpass
expressions rationnelles limitées (pas de PCRE)
outils de contrôle qualité (Osmose…)
…

Faut-il les nettoyer ?
gros travail…
la clé wikidata permet de gérer les libellés en plusieurs langues, les 
synonymes, les relations entre objets, les identifiants externes…

Si oui, comment ?
contrôles et corrections automatiques dans l’éditeur
…

—
Yves

PS: Quelques exemples :

wikipedia=fr:Phare
wikipedia_1=es:Faro
wikipedia_2=de:Leuchtturm
wikipedia_3=fa:فانوس دریایی
…

Il y a en avait beaucoup, c’est presque tout nettoyé. Est-ce que ça reviendra 
avec l’arrivée de contributeurs débutants ?

Préfixe de langue manquant
wikipedia=Phare
brand:wikipedia=McDonald's

Préfixe de langue incomplet (pb de copier/coller ?)
wikipedia=n:Connections Museum
operator:wikipedia=e:BDZ Deutsche Zoll- und Finanzgewerkschaft
brand:wikipedia=u:Россельхозбанк

Préfixes de langues correctes (norme ISO) mais sans site linguistique wikipédia 
correspondant

url complète et ses variantes
wikipedia=https://fr.wikipedia.org/wiki/Phare

url vers un site n’ayant rien à voir avec wikipedia
wikipedia=http://undar.edu.pe/

url avec un préfixe de langue rajouté !
wikipedia=fr:https://fr.wikipedia.org/wiki/Phare

mauvais séparateur . ; …
wikipedia=fr.Château_Mathelin

Photos wikimedia commons avec préfixe de langue
wikipedia=it:File:Alfred Nobel - Villa in Sanremo.jpg
wikipedia=fr:Canal Saint-Félix#/media/File:W1785-Nantes CanalStFelix Ecluse 
85749.JPG
wikipedia=de:Datei:Prichsenstadt BW 6.JPG
wikipedia=fr:Fichier:Bouvines Monument au morts.jpg
Valeurs multiples :
wikipedia=en:Izadshahr, fa:ایزدشهر
…

Des clés incorrectes :

Suffixes de langue inappropriés :
brand:wikipedia_1
brand:wikipedia:ar
…
subject:wikipedia:de
subject:wikipedia:en
…
artist:wikipedia:et

Tags d'éléments « supprimés »
abandoned:brand:wikipedia
abandoned:wikipedia
demolished:brand:wikipedia
demolished:wikipedia
former_operator:wikipedia
former:operator:wikipedia
not:brand:wikipedia
old_brand:wikipedia
old_name:wikipedia
old_wikipedia
old_wikipedia:zh
old:wikipedia
razed:wikipedia
was:brand:wikipedia
was:operator:wikipedia
was:wikipedia

Faut-il les supprimer ?

…

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr