Bonjour,

Dans le cadre de mon travail nous organisons cet événement concernant le linked data web et la plateforme d'enrichissement de données Datalift. La communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des plus grand jeux de données du linked data web avec 20 milliards de triplets : http://linkedgeodata.org/ (même si le service n'en est qu'à ses débuts). Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de ces technos pour des développements plus simples et plus rapide : par exemple, des croisements d'OSM avec DBpedia (extraction de wikipedia sous forme de données).

Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons pas beaucoup de place et nous souhaitons privilégier une certaine diversité d'acteurs, donc je compte limiter les inscrits OSM à 2-3 places max. La cible de l'événement est plutôt les producteurs de données et principalement open data : il y aura donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.

CharlesNepote


-------- Message original --------
Sujet:  Invitation au Datalift Camp
Date :  Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
De :    Charles Nepote <[email protected]>

        
Pour :  Charles Nepote <[email protected]>



 Datalift Camp, Paris


   /Valorisez vos données tout en vous formant au web sémantique/

_Une journée de formation-action, à choisir entre le mardi 9 ou le mercredi 10 octobre 2012 _

//

/« Comment intéresser des créateurs à la réutilisation de nos données alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment inciter ce développeur à adapter son application à notre territoire/notre domaine ? ... Des réutilisateurs se plaignent régulièrement que le croisement de données est un travail long et fastidieux, comment leur faciliter la vie ? ... Nous avons publié nos budgets avec une vraie volonté de transparence, mais tout le monde nous dit qu'il est impossible de les comparer avec ceux du territoire d'à côté ! ... Pour cette base de données cruciale nous recherchons une liste de référence des espèces végétales de ce territoire : où la trouver et comment voir si elle évolue ? ... La liste de nos élus sur nos différents supports numériques n'est jamais à jour, comment optimiser ça ? / /»/

Le web des données -- ou web sémantique -- est la *promesse d'un web centré sur les données*, un web où les données de toutes formes et de tous acteurs se trouvent normalisées, identifiées sans ambiguïté et reliées les unes aux autres. Un web où la création de nouveaux services, de nouveaux usages, de nouveaux croisements des données est grandement simplifié.

Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs dizaines d'organisations dans le monde utilisent ces technologies qui créent un véritable saut qualitatif dans la gestion et valorisation des données -- on parle de "données 5 étoiles <http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>". Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il possible de produire des données "5 étoiles" en quelques heures ? sur la base de mes fichiers CSV ? pour quels gains ?

Depuis environ un an, une équipe constituée de quelques uns des meilleurs spécialistes français du web sémantique, s'est attelée à la tâche au sein d’un projet de recherche ANR.

Datalift <http://datalift.org/>, c'est son nom, est une plateforme open source qui élève vos données brutes structurées (bases de données, CSV, XML, SHP, etc.) vers des données sémantiques interconnectées.

A l'heure où la plateforme est désormais fonctionnelle, l’équipe Datalift vous propose une *journée de formation-action avec deux objectifs forts* <http://datalift.eventvride.fr/>.

*1. Comprendre*

*Comment les technos du web sémantique peuvent-elles booster vos données  ?*

 *

   donner un identifiant à chaque donnée lui donne de la valeur :
   comment ? Pourquoi ?

 *

   normaliser les propriétés et valeurs de chaque donnée pour augmenter
   leur interopérabilité

 *

   comment réaliser des croisements entre vos données et celles
   d'autres acteurs  ?

 *

   comment toutes ces techniques, au final, contribuent à simplifier au
   maximum la vie des développeurs

En introduction et, par la pratique, tout au long de la journée, des experts du web des données vous amènent à comprendre chacun des bénéfices de ces technologies.

*2. Agir*

*A l'aide de l'outil open source Datalift, boostez vous-même vos propres jeux de données *

 *

   donner un identifiant à toutes vos données

 *

   les convertir dans le format standard du web sémantique (RDF)

 *

   les croiser avec d'autres jeux de données, dont des jeux de données
   de référence sélectionnés par l'équipe Datalift

 *

   les publier sur internet en quelques clics : chaque donnée devient
   ainsi accessible depuis un navigateur et vos jeux de données sont
   interrogeables via l'API standard du web sémantique (SPARQL).

A l'issue de cette journée, vous repartez avec certains de vos jeux de données enrichis et désormais prêts pour une valorisation plus complète.

Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces données en production ou bien le réaliser pour vous.

*Valorisez dans la foulée vos données liftées : le hackathon "données 5 étoiles"*

Fin novembre, faisant suite à cette formation-action, l'équipe Datalift organisera un « hackathon » – moment créatif de prototypage d'applications – pour valoriser notamment les données que vous aurez produites. Cet événement ouvert et dédié aux réutilisateurs, vous offre la possibilité de valoriser vos données liftées et d'aller plus loin dans la compréhension des usages rendus possibles.

*Les modalités concrètes *

*Pour qui ?*

 *

   en priorité, les producteurs de données : territoires engagés dans
   l'open data, acteurs publics nationaux, associations, entreprises,
   scientifiques et acteurs du monde de la recherche, acteurs de la
   culture, etc.

 *

   les éditeurs/fournisseurs de plateformes de gestion de données (dont
   plateformes open data)

 *

   les principaux experts, personnalités et prescripteurs de l'open
   data en France.

Il n'est pas nécessaire d'avoir un profil de développeur ni même de connaissances techniques sur le web sémantique.

*Où et quand ?*

Localisé à Paris intra-muros (précisé ultérieurement), l’événement rassemble environ 80 participants au total. L'événement se déroule sur _une seule journée_ mais vous avez le _choix de votre jour_ : mardi 9 octobre *ou* mercredi 10 octobre.

*Déroulé.*

09h30 : accueil.

10h00 : Le web sémantique : bénéfices et perspectives ; brève présentation de la plateforme Datalift ; questions.

11h15 : Phase collective d'évaluation des jeux de données que vous souhaiteriez enrichir : faisabilité possible dans le cadre de la journée, croisements avec des jeux de données de référence, croisements avec d'autres partenaires, etc.

12h15 : pause déjeuner.

13h30 : Pratique : les participants se répartissent en petits groupes (3-6 personnes) où chaque participant, encadré par les experts Datalift, met les mains dans le cambouis -- si possible avec ses propres données.

17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ? quelles opportunités et difficultés identifiées ?

17h30 : Fin de la session.

*De quoi ai-je besoin pour venir ? *

 *

   s'inscrire impérativement – l'entrée est libre et gratuite :
   http://dataliftcamp.eventbrite.fr/

 *

   si possible venir avec son PC portable pour la pratique ; la
   connexion internet via wifi est prévue sur place

 *

   éventuellement, commencer à regarder vos jeux de données et
   réfléchir à ceux qui auraient le plus de sens pour vous

 *

   les repas ne sont pas pris en charge mais, si vous le souhaitez, un
   déjeuner de groupe est proposé (~15-20€)

*Les partenaires de Datalift*

Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX), l'INSEE, le LIRMM, Mondeca et la Fing.

http://datalift.org/




_______________________________________________
Talk-fr mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à