Le 12/09/2012 17:20, Emilie Laffray a écrit :

Bonjour,

Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que l'évolution vers des triplets et réf soit viable toutefois.

Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.


Je serai curieuse de savoir comment l'adressage des données se fait puisque les données dans Osm ne sont pas fixes en soi.

C'est est un problème par exemple dans dbpedia, que le groupe dbpedia lite a résolu : "Unlike dbpedia is it uses stable Wikipedia pageIds in its URIs to attempt to mitigate the problems of article titles changing over time. If the title of a Wikipedia page changes, the dbpedia lite URI will stay the same. This makes it safer to store dbpedia lite identifiers in your own database." http://dbpedialite.org/ (2e paragraphe). Je ne connais pas assez bien le modèle de données d'OSM mais je pensais que chaque objet avait un ID qui lui ne change pas, non ? Ex : http://linkedgeodata.org/page/triplify/way27743320

ChN

Emilie laffray

On Sep 12, 2012 11:14 PM, "Charles Nepote" <[email protected] <mailto:[email protected]>> wrote:

    Bonjour,

    Dans le cadre de mon travail nous organisons cet événement
    concernant le linked data web et la plateforme d'enrichissement de
    données Datalift. La communauté OSM est concernée puisqu'elle
    fournit aujourd'hui l'un des plus grand jeux de données du linked
    data web avec 20 milliards de triplets : http://linkedgeodata.org/
    (même si le service n'en est qu'à ses débuts).
    Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
    de ces technos pour des développements plus simples et plus rapide
    : par exemple, des croisements d'OSM avec DBpedia (extraction de
    wikipedia sous forme de données).

    Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
    n'avons pas beaucoup de place et nous souhaitons privilégier une
    certaine diversité d'acteurs, donc je compte limiter les inscrits
    OSM à 2-3 places max. La cible de l'événement est plutôt les
    producteurs de données et principalement open data : il y aura
    donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.

    CharlesNepote


    -------- Message original --------
    Sujet:      Invitation au Datalift Camp
    Date :      Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
    De :        Charles Nepote <[email protected]>
    <mailto:[email protected]>

        
    Pour :      Charles Nepote <[email protected]>
    <mailto:[email protected]>



      Datalift Camp, Paris


        /Valorisez vos données tout en vous formant au web sémantique/

    _Une journée de formation-action, à choisir entre le mardi 9 ou le
    mercredi 10 octobre 2012 _

    //

    /« Comment intéresser des créateurs à la réutilisation de nos
    données alors qu'elles ne sont compatibles avec rien d'existant ?
    ... Comment inciter ce développeur à adapter son application à
    notre territoire/notre domaine ? ... Des réutilisateurs se
    plaignent régulièrement que le croisement de données est un
    travail long et fastidieux, comment leur faciliter la vie ? ...
    Nous avons publié nos budgets avec une vraie volonté de
    transparence, mais tout le monde nous dit qu'il est impossible de
    les comparer avec ceux du territoire d'à côté ! ... Pour cette
    base de données cruciale nous recherchons une liste de référence
    des espèces végétales de ce territoire : où la trouver et comment
    voir si elle évolue ? ... La liste de nos élus sur nos différents
    supports numériques n'est jamais à jour, comment optimiser ça ? / /»/

    Le web des données -- ou web sémantique -- est la *promesse d'un
    web centré sur les données*, un web où les données de toutes
    formes et de tous acteurs se trouvent normalisées, identifiées
    sans ambiguïté et reliées les unes aux autres. Un web où la
    création de nouveaux services, de nouveaux usages, de nouveaux
    croisements des données est grandement simplifié.

    Cette *promesse devient progressivement réalité*. Aujourd'hui
    plusieurs dizaines d'organisations dans le monde utilisent ces
    technologies qui créent un véritable saut qualitatif dans la
    gestion et valorisation des données -- on parle de "données 5
    étoiles
    
<http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>".
    Comment font-elles ? En combien de temps ? Avec quels résultats ?
    Est-il possible de produire des données "5 étoiles" en quelques
    heures ? sur la base de mes fichiers CSV ? pour quels gains ?

    Depuis environ un an, une équipe constituée de quelques uns des
    meilleurs spécialistes français du web sémantique, s'est attelée à
    la tâche au sein d’un projet de recherche ANR.

    Datalift <http://datalift.org/>, c'est son nom, est une plateforme
    open source qui élève vos données brutes structurées (bases de
    données, CSV, XML, SHP, etc.) vers des données sémantiques
    interconnectées.

    A l'heure où la plateforme est désormais fonctionnelle, l’équipe
    Datalift vous propose une *journée de formation-action avec deux
    objectifs forts* <http://datalift.eventvride.fr/>.

    *1. Comprendre*

    *Comment les technos du web sémantique peuvent-elles booster vos
    données  ?*

     *

        donner un identifiant à chaque donnée lui donne de la valeur :
        comment ? Pourquoi ?

     *

        normaliser les propriétés et valeurs de chaque donnée pour
        augmenter leur interopérabilité

     *

        comment réaliser des croisements entre vos données et celles
        d'autres acteurs  ?

     *

        comment toutes ces techniques, au final, contribuent à
        simplifier au maximum la vie des développeurs

    En introduction et, par la pratique, tout au long de la journée,
    des experts du web des données vous amènent à comprendre chacun
    des bénéfices de ces technologies.

    *2. Agir*

    *A l'aide de l'outil open source Datalift, boostez vous-même vos
    propres jeux de données *

     *

        donner un identifiant à toutes vos données

     *

        les convertir dans le format standard du web sémantique (RDF)

     *

        les croiser avec d'autres jeux de données, dont des jeux de
        données de référence sélectionnés par l'équipe Datalift

     *

        les publier sur internet en quelques clics : chaque donnée
        devient ainsi accessible depuis un navigateur et vos jeux de
        données sont interrogeables via l'API standard du web
        sémantique (SPARQL).

    A l'issue de cette journée, vous repartez avec certains de vos
    jeux de données enrichis et désormais prêts pour une valorisation
    plus complète.

    Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces
    données en production ou bien le réaliser pour vous.

    *Valorisez dans la foulée vos données liftées : le hackathon
    "données 5 étoiles"*

    Fin novembre, faisant suite à cette formation-action, l'équipe
    Datalift organisera un « hackathon » – moment créatif de
    prototypage d'applications – pour valoriser notamment les données
    que vous aurez produites. Cet événement ouvert et dédié aux
    réutilisateurs, vous offre la possibilité de valoriser vos données
    liftées et d'aller plus loin dans la compréhension des usages
    rendus possibles.

    *Les modalités concrètes *

    *Pour qui ?*

     *

        en priorité, les producteurs de données : territoires engagés
        dans l'open data, acteurs publics nationaux, associations,
        entreprises, scientifiques et acteurs du monde de la
        recherche, acteurs de la culture, etc.

     *

        les éditeurs/fournisseurs de plateformes de gestion de données
        (dont plateformes open data)

     *

        les principaux experts, personnalités et prescripteurs de
        l'open data en France.

    Il n'est pas nécessaire d'avoir un profil de développeur ni même
    de connaissances techniques sur le web sémantique.

    *Où et quand ?*

    Localisé à Paris intra-muros (précisé ultérieurement), l’événement
    rassemble environ 80 participants au total. L'événement se déroule
    sur _une seule journée_ mais vous avez le _choix de votre jour_ :
    mardi 9 octobre *ou* mercredi 10 octobre.

    *Déroulé.*

    09h30 : accueil.

    10h00 : Le web sémantique : bénéfices et perspectives ; brève
    présentation de la plateforme Datalift ; questions.

    11h15 : Phase collective d'évaluation des jeux de données que vous
    souhaiteriez enrichir : faisabilité possible dans le cadre de la
    journée, croisements avec des jeux de données de référence,
    croisements avec d'autres partenaires, etc.

    12h15 : pause déjeuner.

    13h30 : Pratique : les participants se répartissent en petits
    groupes (3-6 personnes) où chaque participant, encadré par les
    experts Datalift, met les mains dans le cambouis -- si possible
    avec ses propres données.

    17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ?
    quelles opportunités et difficultés identifiées ?

    17h30 : Fin de la session.

    *De quoi ai-je besoin pour venir ? *

     *

        s'inscrire impérativement – l'entrée est libre et gratuite :
        http://dataliftcamp.eventbrite.fr/

     *

        si possible venir avec son PC portable pour la pratique ; la
        connexion internet via wifi est prévue sur place

     *

        éventuellement, commencer à regarder vos jeux de données et
        réfléchir à ceux qui auraient le plus de sens pour vous

     *

        les repas ne sont pas pris en charge mais, si vous le
        souhaitez, un déjeuner de groupe est proposé (~15-20€)

    *Les partenaires de Datalift*

    Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX),
    l'INSEE, le LIRMM, Mondeca et la Fing.

    http://datalift.org/





    _______________________________________________
    Talk-fr mailing list
    [email protected] <mailto:[email protected]>
    http://lists.openstreetmap.org/listinfo/talk-fr


_______________________________________________
Talk-fr mailing list
[email protected]
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à