Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit : 2012/9/12 Charles Nepote char...@nepote.org Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là encore avec un ID qui pourrait avoir changé. La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un objet (avec une certaine marge) et un ou plusieurs attributs (tags) qualifiant cet objet. Surtout pas l'ID. Wikipedia a résolu ce problème en utilisant une application tiers qui permet de retrouver l'ID d'un objet OSM à partir des critères précédents : http://wiki.openstreetmap.org/wiki/WIWOSM Bonjour Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est présent, ce qui est un peu différent de critères propres à l'objet OSM Par contre Overpass API développe le concept de permanent ID autour de ses requêtes. A noter le template wiki disponible qui permet de ne plus avoir à rentrer d'Id OSM dans les pages du wiki OSM. http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID A+ Bruno ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Le concept de permanent ID est fortement lié à celui des ref:*. Autrement dit la permanence est liée surtout à l'existence d'un autre objet dans une autre base de données (qui au passage peut aussi évoluer et ne pas garder cette permanence). Puisque ces références externes ne sont pas plus stables que celles internes à OSM (id=*) on en revient à la sélection de tags de références externes, ces tags étant spécifiques pour chaque base. Dans ce cas la clé wikipedia n'est rien d'autre qu'une autre ref dans son propre domaine. Il n'y a pas de réelle différence de comportement. Reste à savoir quelle clé est la plus pertinente pour référencer une autre base et faciliter le rapprochement entre elle et OSM. Effectivement id=* n'est pas approprié, mais wikipedia=* est tout à fait approprié dans OSM, même si un jour l'article Wikipedia est renommé (les ids internes de Wikipedia réellement permanent sont les numéros de version d'articles, pas les titres, mais leur contenu peut ne plus correspondre à ce qu'on voudrait référencer et qui doit suivre aussi les évolutions). Il n'y a donc pas de réelle référence permanente d'une base à l'autre. On choisit juste la clé et sa valeur qui permet de retrouver l'objet le plus facilement et le plus probablement (en admettant que cela ne change pas trop souvent et que chaque base de données suit un schéma d'écolution assurant une certaine stabilité), ou si elle ne peut plus être retrouvée telle quelle, en la qualifiant assez pour que les listes de choix proposés dans une recherche permettent de recréer le lien brisé sans trop de difficultés : une seule clé de référence ne peut pas toujours suffire, et il n'est donc pas inutile dans ce cas de permettre de recroiser avec d'autres valeurs de clé liées, sachant qu'aucune de ces clés n'est réellement permanente. Dans OSM j'aurais tendance à privilégier les identifiants issus d'organismes officiels qui sont en charge de la définition de cet objet (ref:*, par exemple les codes INSEE, des collectivités françaises, voire SIREN ou SIRET et autres numéros RCS, qui évoluent aussi de temps en temps) mais cela ne doit pas dispenser de préciser et croiser aussi d'autres valeurs (notamment name=* ou les codes postaux qu'on croise fans une zone géographique pas trop grande avec le type d'objet indiqué pour permettre de le retrouver de façon floue quand une base ou l'autre a du changer). Il n'y a donc aucun schéma universel : à chaque type d'objet et selon sa zone géographique correspond des clés et valeurs de clés plus pertinentes que d'autres. Formaliser ça dans un modèle unique valable partout relève de l'utopie, ce modèle parfait n'existant pas. Le 13 septembre 2012 14:45, Bruno Cortial bruno.cort...@laposte.net a écrit : Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là encore avec un ID qui pourrait avoir changé. La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un objet (avec une certaine marge) et un ou plusieurs attributs (tags) qualifiant cet objet. Surtout pas l'ID. Wikipedia a résolu ce problème en utilisant une application tiers qui permet de retrouver l'ID d'un objet OSM à partir des critères précédents : http://wiki.openstreetmap.org/wiki/WIWOSM Il me semble que WIWOSM ne fonctionne que si la clé wikipedia est présent, ce qui est un peu différent de critères propres à l'objet OSM Par contre Overpass API développe le concept de permanent ID autour de ses requêtes. A noter le template wiki disponible qui permet de ne plus avoir à rentrer d'Id OSM dans les pages du wiki OSM. http://wiki.openstreetmap.org/wiki/Overpass_API/Permanent_ID ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Bonjour, Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que l'évolution vers des triplets et réf soit viable toutefois. Je serai curieuse de savoir comment l'adressage des données se fait puisque les données dans Osm ne sont pas fixes en soi. Emilie laffray On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org wrote: Bonjour, Dans le cadre de mon travail nous organisons cet événement concernant le linked data web et la plateforme d'enrichissement de données Datalift. La communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des plus grand jeux de données du linked data web avec 20 milliards de triplets : http://linkedgeodata.org/ (même si le service n'en est qu'à ses débuts). Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de ces technos pour des développements plus simples et plus rapide : par exemple, des croisements d'OSM avec DBpedia (extraction de wikipedia sous forme de données). Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons pas beaucoup de place et nous souhaitons privilégier une certaine diversité d'acteurs, donc je compte limiter les inscrits OSM à 2-3 places max. La cible de l'événement est plutôt les producteurs de données et principalement open data : il y aura donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc. CharlesNepote Message original Sujet: Invitation au Datalift Camp Date : Wed, 12 Sep 2012 12:22:44 + (UTC) De : Charles Nepote charles.nep...@fing.org charles.nep...@fing.org Pour : Charles Nepote charles.nep...@fing.orgcharles.nep...@fing.org Datalift Camp, Paris * Valorisez vos données tout en vous formant au web sémantique* *Une journée de formation-action, à choisir entre le mardi 9 ou le mercredi 10 octobre 2012 * * * *« Comment intéresser des créateurs à la réutilisation de nos données alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment inciter ce développeur à adapter son application à notre territoire/notre domaine ? ... Des réutilisateurs se plaignent régulièrement que le croisement de données est un travail long et fastidieux, comment leur faciliter la vie ? ... Nous avons publié nos budgets avec une vraie volonté de transparence, mais tout le monde nous dit qu'il est impossible de les comparer avec ceux du territoire d'à côté ! ... Pour cette base de données cruciale nous recherchons une liste de référence des espèces végétales de ce territoire : où la trouver et comment voir si elle évolue ? ... La liste de nos élus sur nos différents supports numériques n'est jamais à jour, comment optimiser ça ? * *»* Le web des données -- ou web sémantique -- est la *promesse d'un web centré sur les données*, un web où les données de toutes formes et de tous acteurs se trouvent normalisées, identifiées sans ambiguïté et reliées les unes aux autres. Un web où la création de nouveaux services, de nouveaux usages, de nouveaux croisements des données est grandement simplifié. Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs dizaines d'organisations dans le monde utilisent ces technologies qui créent un véritable saut qualitatif dans la gestion et valorisation des données -- on parle de données 5 étoileshttp://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles. Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il possible de produire des données 5 étoiles en quelques heures ? sur la base de mes fichiers CSV ? pour quels gains ? Depuis environ un an, une équipe constituée de quelques uns des meilleurs spécialistes français du web sémantique, s'est attelée à la tâche au sein d’un projet de recherche ANR. Datalift http://datalift.org/, c'est son nom, est une plateforme open source qui élève vos données brutes structurées (bases de données, CSV, XML, SHP, etc.) vers des données sémantiques interconnectées. A l'heure où la plateforme est désormais fonctionnelle, l’équipe Datalift vous propose une *journée de formation-action avec deux objectifs forts*http://datalift.eventvride.fr/ . *1. Comprendre* *Comment les technos du web sémantique peuvent-elles booster vos données ?* - donner un identifiant à chaque donnée lui donne de la valeur : comment ? Pourquoi ? - normaliser les propriétés et valeurs de chaque donnée pour augmenter leur interopérabilité - comment réaliser des croisements entre vos données et celles d'autres acteurs ? - comment toutes ces techniques, au final, contribuent à simplifier au maximum la vie des développeurs En introduction et, par la pratique, tout au long de la journée, des experts du web des données vous amènent à comprendre chacun des bénéfices de ces technologies. *2. Agir* *A l'aide de l'outil open source Datalift, boostez vous-même vos
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Le 12/09/2012 17:20, Emilie Laffray a écrit : Bonjour, Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que l'évolution vers des triplets et réf soit viable toutefois. Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse. Je serai curieuse de savoir comment l'adressage des données se fait puisque les données dans Osm ne sont pas fixes en soi. C'est est un problème par exemple dans dbpedia, que le groupe dbpedia lite a résolu : Unlike dbpedia is it uses stable Wikipedia pageIds in its URIs to attempt to mitigate the problems of article titles changing over time. If the title of a Wikipedia page changes, the dbpedia lite URI will stay the same. This makes it safer to store dbpedia lite identifiers in your own database. http://dbpedialite.org/ (2e paragraphe). Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320 ChN Emilie laffray On Sep 12, 2012 11:14 PM, Charles Nepote char...@nepote.org mailto:char...@nepote.org wrote: Bonjour, Dans le cadre de mon travail nous organisons cet événement concernant le linked data web et la plateforme d'enrichissement de données Datalift. La communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des plus grand jeux de données du linked data web avec 20 milliards de triplets : http://linkedgeodata.org/ (même si le service n'en est qu'à ses débuts). Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de ces technos pour des développements plus simples et plus rapide : par exemple, des croisements d'OSM avec DBpedia (extraction de wikipedia sous forme de données). Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons pas beaucoup de place et nous souhaitons privilégier une certaine diversité d'acteurs, donc je compte limiter les inscrits OSM à 2-3 places max. La cible de l'événement est plutôt les producteurs de données et principalement open data : il y aura donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc. CharlesNepote Message original Sujet: Invitation au Datalift Camp Date : Wed, 12 Sep 2012 12:22:44 + (UTC) De :Charles Nepote charles.nep...@fing.org mailto:charles.nep...@fing.org Pour : Charles Nepote charles.nep...@fing.org mailto:charles.nep...@fing.org Datalift Camp, Paris /Valorisez vos données tout en vous formant au web sémantique/ _Une journée de formation-action, à choisir entre le mardi 9 ou le mercredi 10 octobre 2012 _ // /« Comment intéresser des créateurs à la réutilisation de nos données alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment inciter ce développeur à adapter son application à notre territoire/notre domaine ? ... Des réutilisateurs se plaignent régulièrement que le croisement de données est un travail long et fastidieux, comment leur faciliter la vie ? ... Nous avons publié nos budgets avec une vraie volonté de transparence, mais tout le monde nous dit qu'il est impossible de les comparer avec ceux du territoire d'à côté ! ... Pour cette base de données cruciale nous recherchons une liste de référence des espèces végétales de ce territoire : où la trouver et comment voir si elle évolue ? ... La liste de nos élus sur nos différents supports numériques n'est jamais à jour, comment optimiser ça ? / /»/ Le web des données -- ou web sémantique -- est la *promesse d'un web centré sur les données*, un web où les données de toutes formes et de tous acteurs se trouvent normalisées, identifiées sans ambiguïté et reliées les unes aux autres. Un web où la création de nouveaux services, de nouveaux usages, de nouveaux croisements des données est grandement simplifié. Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs dizaines d'organisations dans le monde utilisent ces technologies qui créent un véritable saut qualitatif dans la gestion et valorisation des données -- on parle de données 5 étoiles http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles. Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il possible de produire des données 5 étoiles en quelques heures ? sur la base de mes fichiers CSV ? pour quels gains ? Depuis environ un an, une équipe constituée de quelques uns des meilleurs spécialistes français du web sémantique, s'est attelée à la tâche au sein d’un projet de recherche ANR. Datalift http://datalift.org/, c'est son nom, est une plateforme open source qui élève vos données brutes structurées (bases de données, CSV, XML, SHP,
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
2012/9/12 Charles Nepote char...@nepote.org Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là encore avec un ID qui pourrait avoir changé. La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un objet (avec une certaine marge) et un ou plusieurs attributs (tags) qualifiant cet objet. Surtout pas l'ID. Wikipedia a résolu ce problème en utilisant une application tiers qui permet de retrouver l'ID d'un objet OSM à partir des critères précédents : http://wiki.openstreetmap.org/wiki/WIWOSM Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Tout à fait d'accord. Le cas typique estcelui de l'objet initialement défini comme un way fermé unique, transformé en relation avant que ses ways soient découpés. Aucun des ways qui résultent de ce découpage ne founit un ID correct même si un d'eux est conservé (aucune garantie là-dessus non plus car quand on fait cette trasnformation, typiquement c'est pour faire des fusions de ways superposés, celui qui reste après la fusion n'est pas forcément celui utilisé). Les références stables c'est plutôt les ref:* (concernant les objets liés à une autre base de données disposant d'identifiants uniques dans celle-ci). Ils sont faits pour ça ! Exemples : code INSEE (France), codes INS/NIS (Belgique), codes IMSE (Monaco), etc. ou encore les codes FKGZ (hydrographie en Allemagne). Et à défaut d'identifiant externe clair, c'est le type d'objet (attributs/tags dans OSM, features dans les extractions GIS) dans un secteur géographique limité qui servira de liant (flou car non nécessairement unique si on ne l'associe pas à une base de données externe de référence spécifique). Le 12 septembre 2012 18:50, Pieren pier...@gmail.com a écrit : 2012/9/12 Charles Nepote char...@nepote.org Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là encore avec un ID qui pourrait avoir changé. La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un objet (avec une certaine marge) et un ou plusieurs attributs (tags) qualifiant cet objet. Surtout pas l'ID. Wikipedia a résolu ce problème en utilisant une application tiers qui permet de retrouver l'ID d'un objet OSM à partir des critères précédents : http://wiki.openstreetmap.org/wiki/WIWOSM Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Fwd: Invitation au Datalift Camp
Merci Pieren pour les précisions sur mon propos. On Sep 13, 2012 1:51 AM, Pieren pier...@gmail.com wrote: 2012/9/12 Charles Nepote char...@nepote.org Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320 Un objet OSM ne change pas d'ID mais l'objet peut être supprimé et remplacé par un nouveau qui aura un ID différent. Ou encore, dans l'exemple d'une ligne (way), elle peut être coupée en deux puis refusionnée plus-tard, là encore avec un ID qui pourrait avoir changé. La seule de pérenne dans OSM, ce sont les coordonnées géographiques d'un objet (avec une certaine marge) et un ou plusieurs attributs (tags) qualifiant cet objet. Surtout pas l'ID. Wikipedia a résolu ce problème en utilisant une application tiers qui permet de retrouver l'ID d'un objet OSM à partir des critères précédents : http://wiki.openstreetmap.org/wiki/WIWOSM Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr