Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-13 Par sujet Bruno Cortial
Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit :

 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée
 plus-tard, là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM



Bonjour
Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est
présent, ce qui est un peu différent de critères propres à l'objet OSM

Par contre Overpass API développe le concept de permanent ID autour de
ses requêtes. A noter le template wiki disponible qui permet de ne plus
avoir à rentrer d'Id OSM dans les pages du wiki OSM.

http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID


A+
Bruno
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-13 Par sujet Philippe Verdy
Le concept de permanent ID est fortement lié à celui des ref:*.
Autrement dit la permanence est liée surtout à l'existence d'un
autre objet dans une autre base de données (qui au passage peut aussi
évoluer et ne pas garder cette permanence).
Puisque ces références externes ne sont pas plus stables que celles
internes à OSM (id=*) on en revient à la sélection de tags de
références externes, ces tags étant spécifiques pour chaque base.

Dans ce cas la clé wikipedia n'est rien d'autre qu'une autre ref
dans son propre domaine. Il n'y a pas de réelle différence de
comportement. Reste à savoir quelle clé est la plus pertinente pour
référencer une autre base et faciliter le rapprochement entre elle et
OSM. Effectivement id=* n'est pas approprié, mais wikipedia=* est
tout à fait approprié dans OSM, même si un jour l'article Wikipedia
est renommé (les ids internes de Wikipedia réellement permanent sont
les numéros de version d'articles, pas les titres, mais leur contenu
peut ne plus correspondre à ce qu'on voudrait référencer et qui doit
suivre aussi les évolutions).

Il n'y a donc pas de réelle référence permanente d'une base à
l'autre. On choisit juste la clé et sa valeur qui permet de retrouver
l'objet le plus facilement et le plus probablement (en admettant que
cela ne change pas trop souvent et que chaque base de données suit
un schéma d'écolution assurant une certaine stabilité), ou si elle ne
peut plus être retrouvée telle quelle, en la qualifiant assez pour que
les listes de choix proposés dans une recherche permettent de recréer
le lien brisé sans trop de difficultés : une seule clé de référence ne
peut pas toujours suffire, et il n'est donc pas inutile dans ce cas de
permettre de recroiser avec d'autres valeurs de clé liées, sachant
qu'aucune de ces clés n'est réellement permanente.

Dans OSM j'aurais tendance à privilégier les identifiants issus
d'organismes officiels qui sont en charge de la définition de cet
objet (ref:*, par exemple les codes INSEE, des collectivités
françaises, voire SIREN ou SIRET et autres numéros RCS, qui évoluent
aussi de temps en temps) mais cela ne doit pas dispenser de préciser
et croiser aussi d'autres valeurs (notamment name=* ou les codes
postaux qu'on croise fans une zone géographique pas trop grande avec
le type d'objet indiqué pour permettre de le retrouver de façon floue
quand une base ou l'autre a du changer).

Il n'y a donc aucun schéma universel : à chaque type d'objet et selon
sa zone géographique correspond des clés et valeurs de clés plus
pertinentes que d'autres. Formaliser ça dans un modèle unique valable
partout relève de l'utopie, ce modèle parfait n'existant pas.

Le 13 septembre 2012 14:45, Bruno Cortial bruno.cort...@laposte.net a écrit :
 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard,
 là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM


 Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est présent,
 ce qui est un peu différent de critères propres à l'objet OSM

 Par contre Overpass API développe le concept de permanent ID autour de ses
 requêtes. A noter le template wiki disponible qui permet de ne plus avoir à
 rentrer d'Id OSM dans les pages du wiki OSM.

 http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Emilie Laffray
Bonjour,

Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été
évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que l'évolution
vers des triplets et réf soit viable toutefois.
Je serai curieuse de savoir comment l'adressage des données se fait puisque
les données dans Osm ne sont pas fixes en soi.

Emilie laffray
On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org wrote:

  Bonjour,

 Dans le cadre de mon travail nous organisons cet événement concernant le
 linked data web et la plateforme d'enrichissement de données Datalift. La
 communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des plus
 grand jeux de données du linked data web avec 20 milliards de triplets :
 http://linkedgeodata.org/ (même si le service n'en est qu'à ses débuts).
 Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de ces
 technos pour des développements plus simples et plus rapide : par exemple,
 des croisements d'OSM avec DBpedia (extraction de wikipedia sous forme de
 données).

 Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons pas
 beaucoup de place et nous souhaitons privilégier une certaine diversité
 d'acteurs, donc je compte limiter les inscrits OSM à 2-3 places max. La
 cible de l'événement est plutôt les producteurs de données et
 principalement open data : il y aura donc beaucoup d'acteurs publics
 territoriaux, l'IGN, l'INSEE, etc.

 CharlesNepote


  Message original   Sujet: Invitation au Datalift Camp  Date :
 Wed, 12 Sep 2012 12:22:44 + (UTC)  De : Charles Nepote
 charles.nep...@fing.org charles.nep...@fing.org

   Pour : Charles Nepote charles.nep...@fing.orgcharles.nep...@fing.org

   Datalift Camp, Paris * Valorisez vos données tout en vous formant au
 web sémantique*

 *Une journée de formation-action, à choisir entre le mardi 9 ou le
 mercredi 10 octobre 2012 *

 * *

 *« Comment intéresser des créateurs à la réutilisation de nos données
 alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment
 inciter ce développeur à adapter son application à notre territoire/notre
 domaine ? ... Des réutilisateurs se plaignent régulièrement que le
 croisement de données est un travail long et fastidieux, comment leur
 faciliter la vie ? ... Nous avons publié nos budgets avec une vraie volonté
 de transparence, mais tout le monde nous dit qu'il est impossible de les
 comparer avec ceux du territoire d'à côté ! ... Pour cette base de données
 cruciale nous recherchons une liste de référence des espèces végétales de
 ce territoire : où la trouver et comment voir si elle évolue ? ... La liste
 de nos élus sur nos différents supports numériques n'est jamais à jour,
 comment optimiser ça ? * *»*

 Le web des données -- ou web sémantique -- est la *promesse d'un web
 centré sur les données*, un web où les données de toutes formes et de
 tous acteurs se trouvent normalisées, identifiées sans ambiguïté et reliées
 les unes aux autres. Un web où la création de nouveaux services, de
 nouveaux usages, de nouveaux croisements des données est grandement
 simplifié.

 Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs
 dizaines d'organisations dans le monde utilisent ces technologies qui
 créent un véritable saut qualitatif dans la gestion et valorisation des
 données -- on parle de données 5 
 étoileshttp://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles.
 Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il
 possible de produire des données 5 étoiles en quelques heures ? sur la
 base de mes fichiers CSV ? pour quels gains ?

 Depuis environ un an, une équipe constituée de quelques uns des meilleurs
 spécialistes français du web sémantique, s'est attelée à la tâche au sein
 d’un projet de recherche ANR.

 Datalift http://datalift.org/, c'est son nom, est une plateforme open
 source qui élève vos données brutes structurées (bases de données, CSV,
 XML, SHP, etc.) vers des données sémantiques interconnectées.

 A l'heure où la plateforme est désormais fonctionnelle, l’équipe Datalift
 vous propose une *journée de formation-action avec deux objectifs 
 forts*http://datalift.eventvride.fr/
 .

 *1. Comprendre*

 *Comment les technos du web sémantique peuvent-elles booster vos données
  ?*

-

donner un identifiant à chaque donnée lui donne de la valeur :
comment ? Pourquoi ?
 -

normaliser les propriétés et valeurs de chaque donnée pour augmenter
leur interopérabilité
 -

comment réaliser des croisements entre vos données et celles d'autres
acteurs  ?
 -

comment toutes ces techniques, au final, contribuent à simplifier au
maximum la vie des développeurs

  En introduction et, par la pratique, tout au long de la journée, des
 experts du web des données vous amènent à comprendre chacun des bénéfices
 de ces technologies.

 *2. Agir*

 *A l'aide de l'outil open source Datalift, boostez vous-même vos 

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Charles Nepote

Le 12/09/2012 17:20, Emilie Laffray a écrit :


Bonjour,

Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été 
évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que 
l'évolution vers des triplets et réf soit viable toutefois.



Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.


Je serai curieuse de savoir comment l'adressage des données se fait 
puisque les données dans Osm ne sont pas fixes en soi.


C'est est un problème par exemple dans dbpedia, que le groupe dbpedia 
lite a résolu : Unlike dbpedia is it uses stable Wikipedia pageIds in 
its URIs to attempt to mitigate the problems of article titles changing 
over time. If the title of a Wikipedia page changes, the dbpedia lite 
URI will stay the same. This makes it safer to store dbpedia lite 
identifiers in your own database. http://dbpedialite.org/ (2e paragraphe).
Je ne connais pas assez bien le modèle de données d'OSM mais je pensais 
que chaque objet avait un ID qui lui ne change pas, non ? Ex : 
http://linkedgeodata.org/page/triplify/way27743320


ChN


Emilie laffray

On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org 
mailto:char...@nepote.org wrote:


Bonjour,

Dans le cadre de mon travail nous organisons cet événement
concernant le linked data web et la plateforme d'enrichissement de
données Datalift. La communauté OSM est concernée puisqu'elle
fournit aujourd'hui l'un des plus grand jeux de données du linked
data web avec 20 milliards de triplets : http://linkedgeodata.org/
(même si le service n'en est qu'à ses débuts).
Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
de ces technos pour des développements plus simples et plus rapide
: par exemple, des croisements d'OSM avec DBpedia (extraction de
wikipedia sous forme de données).

Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
n'avons pas beaucoup de place et nous souhaitons privilégier une
certaine diversité d'acteurs, donc je compte limiter les inscrits
OSM à 2-3 places max. La cible de l'événement est plutôt les
producteurs de données et principalement open data : il y aura
donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.

CharlesNepote


 Message original 
Sujet:  Invitation au Datalift Camp
Date :  Wed, 12 Sep 2012 12:22:44 + (UTC)
De :Charles Nepote charles.nep...@fing.org
mailto:charles.nep...@fing.org


Pour :  Charles Nepote charles.nep...@fing.org
mailto:charles.nep...@fing.org



  Datalift Camp, Paris


/Valorisez vos données tout en vous formant au web sémantique/

_Une journée de formation-action, à choisir entre le mardi 9 ou le
mercredi 10 octobre 2012 _

//

/« Comment intéresser des créateurs à la réutilisation de nos
données alors qu'elles ne sont compatibles avec rien d'existant ?
... Comment inciter ce développeur à adapter son application à
notre territoire/notre domaine ? ... Des réutilisateurs se
plaignent régulièrement que le croisement de données est un
travail long et fastidieux, comment leur faciliter la vie ? ...
Nous avons publié nos budgets avec une vraie volonté de
transparence, mais tout le monde nous dit qu'il est impossible de
les comparer avec ceux du territoire d'à côté ! ... Pour cette
base de données cruciale nous recherchons une liste de référence
des espèces végétales de ce territoire : où la trouver et comment
voir si elle évolue ? ... La liste de nos élus sur nos différents
supports numériques n'est jamais à jour, comment optimiser ça ? / /»/

Le web des données -- ou web sémantique -- est la *promesse d'un
web centré sur les données*, un web où les données de toutes
formes et de tous acteurs se trouvent normalisées, identifiées
sans ambiguïté et reliées les unes aux autres. Un web où la
création de nouveaux services, de nouveaux usages, de nouveaux
croisements des données est grandement simplifié.

Cette *promesse devient progressivement réalité*. Aujourd'hui
plusieurs dizaines d'organisations dans le monde utilisent ces
technologies qui créent un véritable saut qualitatif dans la
gestion et valorisation des données -- on parle de données 5
étoiles

http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles.
Comment font-elles ? En combien de temps ? Avec quels résultats ?
Est-il possible de produire des données 5 étoiles en quelques
heures ? sur la base de mes fichiers CSV ? pour quels gains ?

Depuis environ un an, une équipe constituée de quelques uns des
meilleurs spécialistes français du web sémantique, s'est attelée à
la tâche au sein d’un projet de recherche ANR.

Datalift http://datalift.org/, c'est son nom, est une plateforme
open source qui élève vos données brutes structurées (bases de
données, CSV, XML, SHP, 

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Pieren
2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé
par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une
ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là
encore avec un ID qui pourrait avoir changé.
La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
objet (avec une certaine marge) et un ou plusieurs attributs (tags)
qualifiant cet objet. Surtout pas l'ID.
Wikipedia a résolu ce problème en utilisant une application tiers qui
permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
http://wiki.openstreetmap.org/wiki/WIWOSM

Pieren
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Philippe Verdy
Tout à fait d'accord. Le cas typique estcelui de l'objet initialement
défini comme un way fermé unique, transformé en relation avant que ses
ways soient découpés. Aucun des ways qui résultent de ce découpage ne
founit un ID correct même si un d'eux est conservé (aucune garantie
là-dessus non plus car quand on fait cette trasnformation, typiquement
c'est pour faire des fusions de ways superposés, celui qui reste après
la fusion n'est pas forcément celui utilisé).

Les références stables c'est plutôt les ref:* (concernant les objets
liés à une autre base de données disposant d'identifiants uniques dans
celle-ci). Ils sont faits pour ça ! Exemples : code INSEE (France),
codes INS/NIS (Belgique), codes IMSE (Monaco), etc. ou encore les
codes FKGZ (hydrographie en Allemagne).

Et à défaut d'identifiant externe clair, c'est le type d'objet
(attributs/tags dans OSM, features dans les extractions GIS) dans un
secteur géographique limité qui servira de liant (flou car non
nécessairement unique si on ne l'associe pas à une base de données
externe de référence spécifique).

Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit :
 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé
 par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une
 ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là
 encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui permet
 de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Emilie Laffray
Merci Pieren pour les précisions sur mon propos.
On Sep 13, 2012 1:51 AM, Pieren pier...@gmail.com wrote:

 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée
 plus-tard, là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr