subject:"Re\: \[OSM\-talk\-fr\] Fwd\: Invitation au Datalift Camp"

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-13 Par sujet Bruno Cortial

Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit :

 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée
 plus-tard, là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM



Bonjour
Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est
présent, ce qui est un peu différent de critères propres à l'objet OSM

Par contre Overpass API développe le concept de permanent ID autour de
ses requêtes. A noter le template wiki disponible qui permet de ne plus
avoir à rentrer d'Id OSM dans les pages du wiki OSM.

http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID


A+
Bruno
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-13 Par sujet Philippe Verdy

Le concept de permanent ID est fortement lié à celui des ref:*.
Autrement dit la permanence est liée surtout à l'existence d'un
autre objet dans une autre base de données (qui au passage peut aussi
évoluer et ne pas garder cette permanence).
Puisque ces références externes ne sont pas plus stables que celles
internes à OSM (id=*) on en revient à la sélection de tags de
références externes, ces tags étant spécifiques pour chaque base.

Dans ce cas la clé wikipedia n'est rien d'autre qu'une autre ref
dans son propre domaine. Il n'y a pas de réelle différence de
comportement. Reste à savoir quelle clé est la plus pertinente pour
référencer une autre base et faciliter le rapprochement entre elle et
OSM. Effectivement id=* n'est pas approprié, mais wikipedia=* est
tout à fait approprié dans OSM, même si un jour l'article Wikipedia
est renommé (les ids internes de Wikipedia réellement permanent sont
les numéros de version d'articles, pas les titres, mais leur contenu
peut ne plus correspondre à ce qu'on voudrait référencer et qui doit
suivre aussi les évolutions).

Il n'y a donc pas de réelle référence permanente d'une base à
l'autre. On choisit juste la clé et sa valeur qui permet de retrouver
l'objet le plus facilement et le plus probablement (en admettant que
cela ne change pas trop souvent et que chaque base de données suit
un schéma d'écolution assurant une certaine stabilité), ou si elle ne
peut plus être retrouvée telle quelle, en la qualifiant assez pour que
les listes de choix proposés dans une recherche permettent de recréer
le lien brisé sans trop de difficultés : une seule clé de référence ne
peut pas toujours suffire, et il n'est donc pas inutile dans ce cas de
permettre de recroiser avec d'autres valeurs de clé liées, sachant
qu'aucune de ces clés n'est réellement permanente.

Dans OSM j'aurais tendance à privilégier les identifiants issus
d'organismes officiels qui sont en charge de la définition de cet
objet (ref:*, par exemple les codes INSEE, des collectivités
françaises, voire SIREN ou SIRET et autres numéros RCS, qui évoluent
aussi de temps en temps) mais cela ne doit pas dispenser de préciser
et croiser aussi d'autres valeurs (notamment name=* ou les codes
postaux qu'on croise fans une zone géographique pas trop grande avec
le type d'objet indiqué pour permettre de le retrouver de façon floue
quand une base ou l'autre a du changer).

Il n'y a donc aucun schéma universel : à chaque type d'objet et selon
sa zone géographique correspond des clés et valeurs de clés plus
pertinentes que d'autres. Formaliser ça dans un modèle unique valable
partout relève de l'utopie, ce modèle parfait n'existant pas.

Le 13 septembre 2012 14:45, Bruno Cortial bruno.cort...@laposte.net a écrit :
 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard,
 là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM


 Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est présent,
 ce qui est un peu différent de critères propres à l'objet OSM

 Par contre Overpass API développe le concept de permanent ID autour de ses
 requêtes. A noter le template wiki disponible qui permet de ne plus avoir à
 rentrer d'Id OSM dans les pages du wiki OSM.

 http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Emilie Laffray

Bonjour,

Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été
évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que l'évolution
vers des triplets et réf soit viable toutefois.
Je serai curieuse de savoir comment l'adressage des données se fait puisque
les données dans Osm ne sont pas fixes en soi.

Emilie laffray
On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org wrote:

Bonjour,

Dans le cadre de mon travail nous organisons cet événement concernant le
linked data web et la plateforme d'enrichissement de données Datalift. La
communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des plus
grand jeux de données du linked data web avec 20 milliards de triplets :
http://linkedgeodata.org/ (même si le service n'en est qu'à ses débuts).
Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de ces
technos pour des développements plus simples et plus rapide : par exemple,
des croisements d'OSM avec DBpedia (extraction de wikipedia sous forme de
données).

Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons pas
beaucoup de place et nous souhaitons privilégier une certaine diversité
d'acteurs, donc je compte limiter les inscrits OSM à 2-3 places max. La
cible de l'événement est plutôt les producteurs de données et
principalement open data : il y aura donc beaucoup d'acteurs publics
territoriaux, l'IGN, l'INSEE, etc.

CharlesNepote

Message original Sujet: Invitation au Datalift Camp Date :
Wed, 12 Sep 2012 12:22:44 + (UTC) De : Charles Nepote
charles.nep...@fing.org charles.nep...@fing.org

Pour : Charles Nepote charles.nep...@fing.orgcharles.nep...@fing.org

Datalift Camp, Paris * Valorisez vos données tout en vous formant au
web sémantique*

*Une journée de formation-action, à choisir entre le mardi 9 ou le
mercredi 10 octobre 2012 *

* *

*« Comment intéresser des créateurs à la réutilisation de nos données
alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment
inciter ce développeur à adapter son application à notre territoire/notre
domaine ? ... Des réutilisateurs se plaignent régulièrement que le
croisement de données est un travail long et fastidieux, comment leur
faciliter la vie ? ... Nous avons publié nos budgets avec une vraie volonté
de transparence, mais tout le monde nous dit qu'il est impossible de les
comparer avec ceux du territoire d'à côté ! ... Pour cette base de données
cruciale nous recherchons une liste de référence des espèces végétales de
ce territoire : où la trouver et comment voir si elle évolue ? ... La liste
de nos élus sur nos différents supports numériques n'est jamais à jour,
comment optimiser ça ? * *»*

Le web des données -- ou web sémantique -- est la *promesse d'un web
centré sur les données*, un web où les données de toutes formes et de
tous acteurs se trouvent normalisées, identifiées sans ambiguïté et reliées
les unes aux autres. Un web où la création de nouveaux services, de
nouveaux usages, de nouveaux croisements des données est grandement
simplifié.

Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs
dizaines d'organisations dans le monde utilisent ces technologies qui
créent un véritable saut qualitatif dans la gestion et valorisation des
données -- on parle de données 5
étoileshttp://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles.
Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il
possible de produire des données 5 étoiles en quelques heures ? sur la
base de mes fichiers CSV ? pour quels gains ?

Depuis environ un an, une équipe constituée de quelques uns des meilleurs
spécialistes français du web sémantique, s'est attelée à la tâche au sein
d’un projet de recherche ANR.

Datalift http://datalift.org/, c'est son nom, est une plateforme open
source qui élève vos données brutes structurées (bases de données, CSV,
XML, SHP, etc.) vers des données sémantiques interconnectées.

A l'heure où la plateforme est désormais fonctionnelle, l’équipe Datalift
vous propose une *journée de formation-action avec deux objectifs
forts*http://datalift.eventvride.fr/
.

*1. Comprendre*

*Comment les technos du web sémantique peuvent-elles booster vos données
?*

donner un identifiant à chaque donnée lui donne de la valeur :
comment ? Pourquoi ?
-

normaliser les propriétés et valeurs de chaque donnée pour augmenter
leur interopérabilité
-

comment réaliser des croisements entre vos données et celles d'autres
acteurs ?
-

comment toutes ces techniques, au final, contribuent à simplifier au
maximum la vie des développeurs

En introduction et, par la pratique, tout au long de la journée, des
experts du web des données vous amènent à comprendre chacun des bénéfices
de ces technologies.

*2. Agir*

*A l'aide de l'outil open source Datalift, boostez vous-même vos

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Charles Nepote

Le 12/09/2012 17:20, Emilie Laffray a écrit :

Bonjour,

Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.

Je serai curieuse de savoir comment l'adressage des données se fait
puisque les données dans Osm ne sont pas fixes en soi.

C'est est un problème par exemple dans dbpedia, que le groupe dbpedia
lite a résolu : Unlike dbpedia is it uses stable Wikipedia pageIds in
its URIs to attempt to mitigate the problems of article titles changing
over time. If the title of a Wikipedia page changes, the dbpedia lite
URI will stay the same. This makes it safer to store dbpedia lite
identifiers in your own database. http://dbpedialite.org/ (2e paragraphe).
Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
que chaque objet avait un ID qui lui ne change pas, non ? Ex :
http://linkedgeodata.org/page/triplify/way27743320

ChN

Emilie laffray

On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org
mailto:char...@nepote.org wrote:

Bonjour,

Dans le cadre de mon travail nous organisons cet événement
concernant le linked data web et la plateforme d'enrichissement de
données Datalift. La communauté OSM est concernée puisqu'elle
fournit aujourd'hui l'un des plus grand jeux de données du linked
data web avec 20 milliards de triplets : http://linkedgeodata.org/
(même si le service n'en est qu'à ses débuts).
Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
de ces technos pour des développements plus simples et plus rapide
: par exemple, des croisements d'OSM avec DBpedia (extraction de
wikipedia sous forme de données).

Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
n'avons pas beaucoup de place et nous souhaitons privilégier une
certaine diversité d'acteurs, donc je compte limiter les inscrits
OSM à 2-3 places max. La cible de l'événement est plutôt les
producteurs de données et principalement open data : il y aura
donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.

CharlesNepote

Message original
Sujet: Invitation au Datalift Camp
Date : Wed, 12 Sep 2012 12:22:44 + (UTC)
De :Charles Nepote charles.nep...@fing.org
mailto:charles.nep...@fing.org

Pour : Charles Nepote charles.nep...@fing.org
mailto:charles.nep...@fing.org

Datalift Camp, Paris

/Valorisez vos données tout en vous formant au web sémantique/

_Une journée de formation-action, à choisir entre le mardi 9 ou le
mercredi 10 octobre 2012 _

/« Comment intéresser des créateurs à la réutilisation de nos
données alors qu'elles ne sont compatibles avec rien d'existant ?
... Comment inciter ce développeur à adapter son application à
notre territoire/notre domaine ? ... Des réutilisateurs se
plaignent régulièrement que le croisement de données est un
travail long et fastidieux, comment leur faciliter la vie ? ...
Nous avons publié nos budgets avec une vraie volonté de
transparence, mais tout le monde nous dit qu'il est impossible de
les comparer avec ceux du territoire d'à côté ! ... Pour cette
base de données cruciale nous recherchons une liste de référence
des espèces végétales de ce territoire : où la trouver et comment
voir si elle évolue ? ... La liste de nos élus sur nos différents
supports numériques n'est jamais à jour, comment optimiser ça ? / /»/

Le web des données -- ou web sémantique -- est la *promesse d'un
web centré sur les données*, un web où les données de toutes
formes et de tous acteurs se trouvent normalisées, identifiées
sans ambiguïté et reliées les unes aux autres. Un web où la
création de nouveaux services, de nouveaux usages, de nouveaux
croisements des données est grandement simplifié.

http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles.
Comment font-elles ? En combien de temps ? Avec quels résultats ?
Est-il possible de produire des données 5 étoiles en quelques
heures ? sur la base de mes fichiers CSV ? pour quels gains ?

Depuis environ un an, une équipe constituée de quelques uns des
meilleurs spécialistes français du web sémantique, s'est attelée à
la tâche au sein d’un projet de recherche ANR.

Datalift http://datalift.org/, c'est son nom, est une plateforme
open source qui élève vos données brutes structurées (bases de
données, CSV, XML, SHP,

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Pieren

2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé
par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une
ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là
encore avec un ID qui pourrait avoir changé.
La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
objet (avec une certaine marge) et un ou plusieurs attributs (tags)
qualifiant cet objet. Surtout pas l'ID.
Wikipedia a résolu ce problème en utilisant une application tiers qui
permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
http://wiki.openstreetmap.org/wiki/WIWOSM

Pieren
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Philippe Verdy

Tout à fait d'accord. Le cas typique estcelui de l'objet initialement
défini comme un way fermé unique, transformé en relation avant que ses
ways soient découpés. Aucun des ways qui résultent de ce découpage ne
founit un ID correct même si un d'eux est conservé (aucune garantie
là-dessus non plus car quand on fait cette trasnformation, typiquement
c'est pour faire des fusions de ways superposés, celui qui reste après
la fusion n'est pas forcément celui utilisé).

Les références stables c'est plutôt les ref:* (concernant les objets
liés à une autre base de données disposant d'identifiants uniques dans
celle-ci). Ils sont faits pour ça ! Exemples : code INSEE (France),
codes INS/NIS (Belgique), codes IMSE (Monaco), etc. ou encore les
codes FKGZ (hydrographie en Allemagne).

Et à défaut d'identifiant externe clair, c'est le type d'objet
(attributs/tags dans OSM, features dans les extractions GIS) dans un
secteur géographique limité qui servira de liant (flou car non
nécessairement unique si on ne l'associe pas à une base de données
externe de référence spécifique).

Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit :
 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé
 par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une
 ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là
 encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui permet
 de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

2012-09-12 Par sujet Emilie Laffray

Merci Pieren pour les précisions sur mon propos.
On Sep 13, 2012 1:51 AM, Pieren pier...@gmail.com wrote:

 2012/9/12 Charles Nepote char...@nepote.org

 Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
 que chaque objet avait un ID qui lui ne change pas, non ? Ex :
 http://linkedgeodata.org/page/triplify/way27743320


 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et
 remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple
 d'une ligne (way), elle peut être coupée en deux puis refusionnée
 plus-tard, là encore avec un ID qui pourrait avoir changé.
 La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un
 objet (avec une certaine marge) et un ou plusieurs attributs (tags)
 qualifiant cet objet. Surtout pas l'ID.
 Wikipedia a résolu ce problème en utilisant une application tiers qui
 permet de retrouver l'ID d'un objet OSM à partir des critères précédents :
 http://wiki.openstreetmap.org/wiki/WIWOSM

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp

7 matches

Site Navigation

Mail list logo

Footer information