Le 12/09/2012 17:20, Emilie Laffray a écrit :
Bonjour,
Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été
évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que
l'évolution vers des triplets et réf soit viable toutefois.
Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.
Je serai curieuse de savoir comment l'adressage des données se fait
puisque les données dans Osm ne sont pas fixes en soi.
C'est est un problème par exemple dans dbpedia, que le groupe dbpedia
lite a résolu : "Unlike dbpedia is it uses stable Wikipedia pageIds in
its URIs to attempt to mitigate the problems of article titles changing
over time. If the title of a Wikipedia page changes, the dbpedia lite
URI will stay the same. This makes it safer to store dbpedia lite
identifiers in your own database." http://dbpedialite.org/ (2e paragraphe).
Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
que chaque objet avait un ID qui lui ne change pas, non ? Ex :
http://linkedgeodata.org/page/triplify/way27743320
ChN
Emilie laffray
On Sep 12, 2012 11:14 PM, "Charles Nepote" <[email protected]
<mailto:[email protected]>> wrote:
Bonjour,
Dans le cadre de mon travail nous organisons cet événement
concernant le linked data web et la plateforme d'enrichissement de
données Datalift. La communauté OSM est concernée puisqu'elle
fournit aujourd'hui l'un des plus grand jeux de données du linked
data web avec 20 milliards de triplets : http://linkedgeodata.org/
(même si le service n'en est qu'à ses débuts).
Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
de ces technos pour des développements plus simples et plus rapide
: par exemple, des croisements d'OSM avec DBpedia (extraction de
wikipedia sous forme de données).
Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
n'avons pas beaucoup de place et nous souhaitons privilégier une
certaine diversité d'acteurs, donc je compte limiter les inscrits
OSM à 2-3 places max. La cible de l'événement est plutôt les
producteurs de données et principalement open data : il y aura
donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.
CharlesNepote
-------- Message original --------
Sujet: Invitation au Datalift Camp
Date : Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
De : Charles Nepote <[email protected]>
<mailto:[email protected]>
Pour : Charles Nepote <[email protected]>
<mailto:[email protected]>
Datalift Camp, Paris
/Valorisez vos données tout en vous formant au web sémantique/
_Une journée de formation-action, à choisir entre le mardi 9 ou le
mercredi 10 octobre 2012 _
//
/« Comment intéresser des créateurs à la réutilisation de nos
données alors qu'elles ne sont compatibles avec rien d'existant ?
... Comment inciter ce développeur à adapter son application à
notre territoire/notre domaine ? ... Des réutilisateurs se
plaignent régulièrement que le croisement de données est un
travail long et fastidieux, comment leur faciliter la vie ? ...
Nous avons publié nos budgets avec une vraie volonté de
transparence, mais tout le monde nous dit qu'il est impossible de
les comparer avec ceux du territoire d'à côté ! ... Pour cette
base de données cruciale nous recherchons une liste de référence
des espèces végétales de ce territoire : où la trouver et comment
voir si elle évolue ? ... La liste de nos élus sur nos différents
supports numériques n'est jamais à jour, comment optimiser ça ? / /»/
Le web des données -- ou web sémantique -- est la *promesse d'un
web centré sur les données*, un web où les données de toutes
formes et de tous acteurs se trouvent normalisées, identifiées
sans ambiguïté et reliées les unes aux autres. Un web où la
création de nouveaux services, de nouveaux usages, de nouveaux
croisements des données est grandement simplifié.
Cette *promesse devient progressivement réalité*. Aujourd'hui
plusieurs dizaines d'organisations dans le monde utilisent ces
technologies qui créent un véritable saut qualitatif dans la
gestion et valorisation des données -- on parle de "données 5
étoiles
<http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>".
Comment font-elles ? En combien de temps ? Avec quels résultats ?
Est-il possible de produire des données "5 étoiles" en quelques
heures ? sur la base de mes fichiers CSV ? pour quels gains ?
Depuis environ un an, une équipe constituée de quelques uns des
meilleurs spécialistes français du web sémantique, s'est attelée à
la tâche au sein d’un projet de recherche ANR.
Datalift <http://datalift.org/>, c'est son nom, est une plateforme
open source qui élève vos données brutes structurées (bases de
données, CSV, XML, SHP, etc.) vers des données sémantiques
interconnectées.
A l'heure où la plateforme est désormais fonctionnelle, l’équipe
Datalift vous propose une *journée de formation-action avec deux
objectifs forts* <http://datalift.eventvride.fr/>.
*1. Comprendre*
*Comment les technos du web sémantique peuvent-elles booster vos
données ?*
*
donner un identifiant à chaque donnée lui donne de la valeur :
comment ? Pourquoi ?
*
normaliser les propriétés et valeurs de chaque donnée pour
augmenter leur interopérabilité
*
comment réaliser des croisements entre vos données et celles
d'autres acteurs ?
*
comment toutes ces techniques, au final, contribuent à
simplifier au maximum la vie des développeurs
En introduction et, par la pratique, tout au long de la journée,
des experts du web des données vous amènent à comprendre chacun
des bénéfices de ces technologies.
*2. Agir*
*A l'aide de l'outil open source Datalift, boostez vous-même vos
propres jeux de données *
*
donner un identifiant à toutes vos données
*
les convertir dans le format standard du web sémantique (RDF)
*
les croiser avec d'autres jeux de données, dont des jeux de
données de référence sélectionnés par l'équipe Datalift
*
les publier sur internet en quelques clics : chaque donnée
devient ainsi accessible depuis un navigateur et vos jeux de
données sont interrogeables via l'API standard du web
sémantique (SPARQL).
A l'issue de cette journée, vous repartez avec certains de vos
jeux de données enrichis et désormais prêts pour une valorisation
plus complète.
Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces
données en production ou bien le réaliser pour vous.
*Valorisez dans la foulée vos données liftées : le hackathon
"données 5 étoiles"*
Fin novembre, faisant suite à cette formation-action, l'équipe
Datalift organisera un « hackathon » – moment créatif de
prototypage d'applications – pour valoriser notamment les données
que vous aurez produites. Cet événement ouvert et dédié aux
réutilisateurs, vous offre la possibilité de valoriser vos données
liftées et d'aller plus loin dans la compréhension des usages
rendus possibles.
*Les modalités concrètes *
*Pour qui ?*
*
en priorité, les producteurs de données : territoires engagés
dans l'open data, acteurs publics nationaux, associations,
entreprises, scientifiques et acteurs du monde de la
recherche, acteurs de la culture, etc.
*
les éditeurs/fournisseurs de plateformes de gestion de données
(dont plateformes open data)
*
les principaux experts, personnalités et prescripteurs de
l'open data en France.
Il n'est pas nécessaire d'avoir un profil de développeur ni même
de connaissances techniques sur le web sémantique.
*Où et quand ?*
Localisé à Paris intra-muros (précisé ultérieurement), l’événement
rassemble environ 80 participants au total. L'événement se déroule
sur _une seule journée_ mais vous avez le _choix de votre jour_ :
mardi 9 octobre *ou* mercredi 10 octobre.
*Déroulé.*
09h30 : accueil.
10h00 : Le web sémantique : bénéfices et perspectives ; brève
présentation de la plateforme Datalift ; questions.
11h15 : Phase collective d'évaluation des jeux de données que vous
souhaiteriez enrichir : faisabilité possible dans le cadre de la
journée, croisements avec des jeux de données de référence,
croisements avec d'autres partenaires, etc.
12h15 : pause déjeuner.
13h30 : Pratique : les participants se répartissent en petits
groupes (3-6 personnes) où chaque participant, encadré par les
experts Datalift, met les mains dans le cambouis -- si possible
avec ses propres données.
17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ?
quelles opportunités et difficultés identifiées ?
17h30 : Fin de la session.
*De quoi ai-je besoin pour venir ? *
*
s'inscrire impérativement – l'entrée est libre et gratuite :
http://dataliftcamp.eventbrite.fr/
*
si possible venir avec son PC portable pour la pratique ; la
connexion internet via wifi est prévue sur place
*
éventuellement, commencer à regarder vos jeux de données et
réfléchir à ceux qui auraient le plus de sens pour vous
*
les repas ne sont pas pris en charge mais, si vous le
souhaitez, un déjeuner de groupe est proposé (~15-20€)
*Les partenaires de Datalift*
Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX),
l'INSEE, le LIRMM, Mondeca et la Fing.
http://datalift.org/
_______________________________________________
Talk-fr mailing list
[email protected] <mailto:[email protected]>
http://lists.openstreetmap.org/listinfo/talk-fr
_______________________________________________
Talk-fr mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-fr