Re: [OSM-dev-fr] Intégration toponymes Occitan

2014-10-03 Par sujet Bruno Cortial
Bonjour,
J'avais fait la manip pour le breton avec Christian Rogel, à base de petits
scripts python.

Je vous retrouve çà...
Bruno
___
dev-fr mailing list
dev-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Intégration toponymes Occitan

2014-10-03 Par sujet Frédéric Rodrigo

Avec les ref insee c'est quand même bien mieux.

Mais je ne suis pas sûr que la qualité des données soit pour l'instant 
suffisante. Tu peux remonté les problèmes et/ou obtenir des 
éclaircissements ?


- certaines traduction qui contienne des virgules, des slashs ou des 
tirets quadratins mal utilisé je pense :

Sent Perdon – Isac : Saint-Pardoux-Isaac
c'est la traduction des noms des communes, ou des noms des villages ?
- le texte entre parenthèse doit probablement être ignoré (à confirmer ?)
- Les-Artigues-de-Lussac : Les Artigues-de-Lussac, des fois il y a des 
tirets, mais dans la plus part des cas ils n'y sont pas.
- L'article n'est pas systématiquement passé entre parenthèse, c'est 
volontaire ?

- le détrompeur est parfois présent, parfois absent :
Castèthnau dau Medòc : Castelnau-de-Médoc
Castra : Castres-Gironde
- les capitales sur les article ne sont pas toujours homogènes:
Senta Fe La Granda : Sainte-Foy-la-Grande
Sent Feliç de font Cauda : Saint-Félix-de-Foncaude


Frédéric.


Le 03/10/2014 00:28, Christophe Merlet a écrit :

Bonjour,


Lo Congrès m'a fait parvenir une mise à jour de son fichier de plus de
4500 toponymes en Occitan indexés sur le code INSEE des communes.

Y a t'il un volontaire pour scripter l'import automatique de ces
traductions sur les limites communales et les node place correspondant ?

Le fichier est téléchargeable à l'adresse
https://owncloud.redfoxcenter.org/public.php?service=filest=f644eccca351c5657e95ab24183edff4


Ce serait bien de le faire car il y a actuellement beaucoup de demande
pour une carto en occitan.


De plus, un colloque est en train d'être organisé par la DGLFLF
(Délégation générale de la langue française et des langues de France, un
département du Ministère de la culture et de la communication) pour
février 2015 sur les ressources numériques des langues de France.

Ce serait pas mal qu'OSM puisse y présenter une carto en Occitan la plus
exhaustive possible à cette occasion.



Librement,




___
dev-fr mailing list
dev-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Intégration toponymes Occitan

2014-10-03 Par sujet Frédéric Rodrigo

Le 03/10/2014 14:20, Christophe Merlet a écrit :

Le 03/10/2014 13:44, Frédéric Rodrigo a écrit :

Avec les ref insee c'est quand même bien mieux.

Mais je ne suis pas sûr que la qualité des données soit pour l'instant
suffisante. Tu peux remonté les problèmes et/ou obtenir des
éclaircissements ?

- certaines traduction qui contienne des virgules, des slashs ou des
tirets quadratins mal utilisé je pense :
 Sent Perdon – Isac : Saint-Pardoux-Isaac
 c'est la traduction des noms des communes, ou des noms des villages ?
- le texte entre parenthèse doit probablement être ignoré (à confirmer ?)
- Les-Artigues-de-Lussac : Les Artigues-de-Lussac, des fois il y a des
tirets, mais dans la plus part des cas ils n'y sont pas.
- L'article n'est pas systématiquement passé entre parenthèse, c'est
volontaire ?
- le détrompeur est parfois présent, parfois absent :
 Castèthnau dau Medòc : Castelnau-de-Médoc
 Castra : Castres-Gironde
- les capitales sur les article ne sont pas toujours homogènes:
 Senta Fe La Granda : Sainte-Foy-la-Grande
 Sent Feliç de font Cauda : Saint-Félix-de-Foncaude



Je suis à la recherche d'une **solution technique** pour mettre à jour
des tags depuis un fichier CSV, pas d'un audit qualité.


Techniquement cela ne pas de problème, en tout cas pour moi. Faire un 
script et intégrer les données dans OSM est l'affaire d'une-demi heure.



Rien n’empêche d'importer les communes qui ne pose aucun problèmes, et
ça en fait des milliers, au lieu de reporter depuis plusieurs mois cet
import. Surtout que les problèmes que tu soulèves sont triviaux et se
corrigent par un simple regexp.


Je pense qu'il vaut quand même mieux corriger les données à la source et 
importer dans OSM les mêmes données que celles publiées par Lo Congrès.



La question est la même que pour la mise à jour des populations de
communes qui aurait du idéalement être fait dés la publication par
l'INSEE des chiffres officiels de 2014.


Idem. Je pense que personne ne le fait parce que l'intérêt est assez faible.


___
dev-fr mailing list
dev-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Intégration toponymes Occitan

2014-10-03 Par sujet Christophe Merlet
Le 03/10/2014 14:30, Frédéric Rodrigo a écrit :
 Le 03/10/2014 14:20, Christophe Merlet a écrit :
 Le 03/10/2014 13:44, Frédéric Rodrigo a écrit :
 Avec les ref insee c'est quand même bien mieux.

 Mais je ne suis pas sûr que la qualité des données soit pour l'instant
 suffisante. Tu peux remonté les problèmes et/ou obtenir des
 éclaircissements ?

 - certaines traduction qui contienne des virgules, des slashs ou des
 tirets quadratins mal utilisé je pense :
  Sent Perdon – Isac : Saint-Pardoux-Isaac
  c'est la traduction des noms des communes, ou des noms des
 villages ?
 - le texte entre parenthèse doit probablement être ignoré (à
 confirmer ?)
 - Les-Artigues-de-Lussac : Les Artigues-de-Lussac, des fois il y a des
 tirets, mais dans la plus part des cas ils n'y sont pas.
 - L'article n'est pas systématiquement passé entre parenthèse, c'est
 volontaire ?
 - le détrompeur est parfois présent, parfois absent :
  Castèthnau dau Medòc : Castelnau-de-Médoc
  Castra : Castres-Gironde
 - les capitales sur les article ne sont pas toujours homogènes:
  Senta Fe La Granda : Sainte-Foy-la-Grande
  Sent Feliç de font Cauda : Saint-Félix-de-Foncaude


 Je suis à la recherche d'une **solution technique** pour mettre à jour
 des tags depuis un fichier CSV, pas d'un audit qualité.
 
 Techniquement cela ne pas de problème, en tout cas pour moi. Faire un
 script et intégrer les données dans OSM est l'affaire d'une-demi heure.

Je n'en ai jamais douté !
Et je constate que tu ne donne toujours aucune piste pour permettre à
quelqu'un d'autre de travailler efficacement sur cet import.

 Rien n’empêche d'importer les communes qui ne pose aucun problèmes, et
 ça en fait des milliers, au lieu de reporter depuis plusieurs mois cet
 import. Surtout que les problèmes que tu soulèves sont triviaux et se
 corrigent par un simple regexp.
 
 Je pense qu'il vaut quand même mieux corriger les données à la source et
 importer dans OSM les mêmes données que celles publiées par Lo Congrès.

Ce serait la première fois que l'on attends d'une source potentiel de
données qu'elle se mette au standard qualité d'OSM au lieu d'effectuer
nous-même ce travail. (ROUTE 500, Cadastre, FANTOIR, ...)

 La question est la même que pour la mise à jour des populations de
 communes qui aurait du idéalement être fait dés la publication par
 l'INSEE des chiffres officiels de 2014.
 
 Idem. Je pense que personne ne le fait parce que l'intérêt est assez
 faible.

Ceux qui y ont un intérêt ne le font pas car il ne savent pas
automatiser une tâche qui nécessite plus de 72000 éditions, et ceux qui
savent automatiser la tache ne le font pas parce qu'ils n'y voit aucun
intérêt. Ce n'est pas très productif.

Et depuis quand avoir la population à jour dans OSM serait sans intérêt ?

Librement,
-- 
Christophe Merlet (RedFox)

___
dev-fr mailing list
dev-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/dev-fr


Re: [OSM-dev-fr] Intégration toponymes Occitan

2014-10-03 Par sujet Frédéric Rodrigo

Le 03/10/2014 14:41, Christophe Merlet a écrit :

Le 03/10/2014 14:30, Frédéric Rodrigo a écrit :

Le 03/10/2014 14:20, Christophe Merlet a écrit :

Le 03/10/2014 13:44, Frédéric Rodrigo a écrit :

Avec les ref insee c'est quand même bien mieux.

Mais je ne suis pas sûr que la qualité des données soit pour l'instant
suffisante. Tu peux remonté les problèmes et/ou obtenir des
éclaircissements ?

- certaines traduction qui contienne des virgules, des slashs ou des
tirets quadratins mal utilisé je pense :
  Sent Perdon – Isac : Saint-Pardoux-Isaac
  c'est la traduction des noms des communes, ou des noms des
villages ?
- le texte entre parenthèse doit probablement être ignoré (à
confirmer ?)
- Les-Artigues-de-Lussac : Les Artigues-de-Lussac, des fois il y a des
tirets, mais dans la plus part des cas ils n'y sont pas.
- L'article n'est pas systématiquement passé entre parenthèse, c'est
volontaire ?
- le détrompeur est parfois présent, parfois absent :
  Castèthnau dau Medòc : Castelnau-de-Médoc
  Castra : Castres-Gironde
- les capitales sur les article ne sont pas toujours homogènes:
  Senta Fe La Granda : Sainte-Foy-la-Grande
  Sent Feliç de font Cauda : Saint-Félix-de-Foncaude



Je suis à la recherche d'une **solution technique** pour mettre à jour
des tags depuis un fichier CSV, pas d'un audit qualité.


Techniquement cela ne pas de problème, en tout cas pour moi. Faire un
script et intégrer les données dans OSM est l'affaire d'une-demi heure.


Je n'en ai jamais douté !
Et je constate que tu ne donne toujours aucune piste pour permettre à
quelqu'un d'autre de travailler efficacement sur cet import.


1. Filtrer les données, la partie qualité qui peut prendre du temps, si 
les données ne sont pas de bonne qualité. Pour Osmose, quand les données 
sont de trop mauvaise facture, je ne fais purement et simplement rien. 
Ce n'est pas les jeux de données ouvert à intégrer à OSM qu'il manque.
2. Extraction des ??? (je ne sais tjs pas si ce sont les traductions des 
noms de communes ou de villages ou un peu des deux) de OSM avec 
overpass-api.
3. Un petit script ruby écrit sur le pouce qui édite les tags osm dépuis 
un hash chargé depuis le CSV.

4. Upload avec JOSM.


Rien n’empêche d'importer les communes qui ne pose aucun problèmes, et
ça en fait des milliers, au lieu de reporter depuis plusieurs mois cet
import. Surtout que les problèmes que tu soulèves sont triviaux et se
corrigent par un simple regexp.


Je pense qu'il vaut quand même mieux corriger les données à la source et
importer dans OSM les mêmes données que celles publiées par Lo Congrès.


Ce serait la première fois que l'on attends d'une source potentiel de
données qu'elle se mette au standard qualité d'OSM au lieu d'effectuer
nous-même ce travail. (ROUTE 500, Cadastre, FANTOIR, ...)


Dans les exemples que tu cites, le processus est vraiment à minima de un 
an pour avoir une mise à jour. Là il me semble que ça soit la cas. Il 
est toujours préférable d'améliorer la source, mais c'est souvent 
impraticable.





La question est la même que pour la mise à jour des populations de
communes qui aurait du idéalement être fait dés la publication par
l'INSEE des chiffres officiels de 2014.


Idem. Je pense que personne ne le fait parce que l'intérêt est assez
faible.


Ceux qui y ont un intérêt ne le font pas car il ne savent pas
automatiser une tâche qui nécessite plus de 72000 éditions, et ceux qui
savent automatiser la tache ne le font pas parce qu'ils n'y voit aucun
intérêt. Ce n'est pas très productif.

Et depuis quand avoir la population à jour dans OSM serait sans intérêt ?

Librement,




___
dev-fr mailing list
dev-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/dev-fr