Re: [OSM-talk-fr] opendata siren

2016-12-23 Par sujet Christian Quest
Tu as un exemple d'intégration sur les pharmacies, que j'ai rapidement fait
pendant le hackathon "opensirene":
http://osmose.openstreetmap.fr/fr/map/#item=7170=99

La première étape consiste à géocoder le mieux possible cette base... ce
qui m'a pris quelques jours pour préparer ce hackathon. C'est pas parfait,
mais franchement exploitable.

Ensuite il faudra faire attention à la temporalité... la diffusion de
SIRENE sera quotidienne (difficile de faire mieux !).
Une entreprise inscrite sera donc visible en principe le lendemain dans la
base, mais son activité sur le terrain pourra ne démarrer que plus tard.
On a le problème inverse des établissements dont l'activité a cessé, mais
qui n'ont pas encore été retirés de SIRENE... et là ça peut prendre un
certain temps.
Dernier point, les adresses correspondent en principe au lieu d'activité,
mais ce n'est pas toujours contrôlé ou mis à jour... donc on peut avoir une
localisation qui ne correspond par à un vrai "POI" au sens OSM.

Il faut aussi bien faire le tri car il n'y a pas que des entreprises, on
trouve aussi des associations et des activités de type profession libérale,
auto-entrepreneur.

Malgré ces limites, c'est une source formidable à utiliser avec un peu de
recul car tout intégrer dans OSM n'est pas forcément bien utile... surtout
que les données seront accessibles à tout le monde.

Je compte remettre en route mon "etat commune" pour indiquer l'écart entre
OSM et entre autre SIRENE pour suggérer des pistes d'améliorations dans OSM
mais vu à la maille d'une commune.


Le 23 décembre 2016 à 17:10, Julien Lepiller  a écrit :

> Bonjour,
>
> aujourd'hui on m'a envoyé ce lien :
> http://www.sirene.fr/sirene/public/static/contenu-fichiers, en rapport
> avec celui-ci :
> https://www.etalab.gouv.fr/louverture-du-repertoire-
> sirene-par-linsee-au-1er-janvier-2017-une-avancee-majeure-pour-lopen-data.
>
> La base sirene sera disponible en opendata à partir de janvier
> prochain. Elle contient les informations que possède l'INSEE sur les
> entreprises françaises et les services publics. On pourrait imaginer
> s'en servir pour améliorer les données concernant ces établissements. On
> trouve dans ces données le nom et l'adresse de l'établissement (on peut
> espérer que leurs adresses ne soient pas toutes des CEDEX), ce qui
> pourrait par exemple être intégré à osmose pour proposer des
> entreprises manquantes.
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>



-- 
Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] opendata siren

2016-12-23 Par sujet Philippe Verdy
Déjà évoqué ici depuis des semaines... Mais la qualité des adresses pose
problème, de même que leur pertinence:
- SIRENE possède des tas d'entrées pour des entreprises qui n'existent plus
ou qui n'existent que sur le papier.
- avec une adresse légale qui n'est pas celle de leur fond de commerce,
mais une adresse de contact (ou d'un gérant ou celle d'un cabinet de
gestion), ou localisées uniquement à leur société mère complètement
ailleurs. Uen société peut être enregistrée légalement n'importe où dans
l'UE, avec uniquement une unique adresse fiscale en France, même si ses
établissements sont répartis sur tout le territoire.

Si on parle du SIREN (entité légale) ce ne sera pas pertinent
géographiquement. Si on parle du SIRET (les établissements) là c'est plus
pertinent géographiquement, mais un même établissement peut aussi avoir des
locaux différents et regrouper tout à une seule adresse alros qu'il y aura
deux commerces distincts (cas courant: deux boutiques de la même enseigne
dans la même ville, avec le même gérant, dont parfois des boutiques
fantômes qui n'existent que pour leur devanture mais sans aucune activité.
On en trouve des tonnes dans les sociétés de service, ou chez les
"dépanneurs" à domicile qui font croire à leur présence dans un quartier
avec juste des pas de porte complètement vides et quelqu'un qui ne fait que
passer de temps en temps relever le courrier, les locaux étant complètement
vides, parfois même sans aucun téléphone). Essayez le localiser des
"garages" par exemple, ou vous trouverez des tas d'adresses fantômes. Idem
pour des tas de SARL et filiales ad hoc dans les SSII (dont les employés
peuvent avoir des contrats mentionnant des noms de société différents de
ceux pour laquelle ils travaillent ensembles avec leurs collègues tous les
jours): ces sociétés existent pour des raisons d'optimisation fiscale ou
pour répondre à des besoins liés à des contrats avec d'autres sociétés, ou
parce que certains contrats exigent des certifications de compétence pour
certains employés, ou parce qu'il y a des engagements budgétaires et
juridiques qui ne doivent pas engager la société mère toute entière, ou
pour des raisons d'optimisation de contrats d'assurance, ou encore pour des
raisons de statuts sociaux différents (employés dont les contrats obéissent
à d'autres conventions collectives, des contrats qu'il n'est pas simple de
modifier sans surcoût)

Bref le SIRENE est un fourre-tout qui sera très difficile à rendre
pertinent géographiquement, sans vérification sur le terrain pour voir s'il
y a une existence réelle. De plus les noms des entreprises sont les noms
légaux et presque jamais les enseignes (allez faire un achat dans un
boutique quelconque le nom légal que vous voyez sur la facture ou la
facturette du ticket de paiement carte bancaire est souvent très différent,
et parfois même quand il y a une adresse indiquée ce n'est pas celle du
lieu de vente!) Faites un achat sur Internet même sur le site désigné comme
"France", et vous serez facturé selon le mode de paiement utilisé par une
société ou une autre, pas forcément en France (et parfois avec une autre
TVA que la TVA française).

Bref cette base SIRENE demandera beaucoup de tri (et je pense même que si
cette base s'est finalement "ouverte", c'est parce que même l'Etat (ou les
tribunaux de commerce) n'y comprend plus rien lui-même et qu'il cherche des
moyens de la corréler avec d'autres choses, en permettant à des applis
tierces de développer des moyens de recherche et croisement d'informations.


Le 23 décembre 2016 à 17:10, Julien Lepiller  a écrit :

> Bonjour,
>
> aujourd'hui on m'a envoyé ce lien :
> http://www.sirene.fr/sirene/public/static/contenu-fichiers, en rapport
> avec celui-ci :
> https://www.etalab.gouv.fr/louverture-du-repertoire-
> sirene-par-linsee-au-1er-janvier-2017-une-avancee-majeure-pour-lopen-data.
>
> La base sirene sera disponible en opendata à partir de janvier
> prochain. Elle contient les informations que possède l'INSEE sur les
> entreprises françaises et les services publics. On pourrait imaginer
> s'en servir pour améliorer les données concernant ces établissements. On
> trouve dans ces données le nom et l'adresse de l'établissement (on peut
> espérer que leurs adresses ne soient pas toutes des CEDEX), ce qui
> pourrait par exemple être intégré à osmose pour proposer des
> entreprises manquantes.
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] opendata siren

2016-12-23 Par sujet Julien Lepiller
Bonjour,

aujourd'hui on m'a envoyé ce lien :
http://www.sirene.fr/sirene/public/static/contenu-fichiers, en rapport
avec celui-ci :
https://www.etalab.gouv.fr/louverture-du-repertoire-sirene-par-linsee-au-1er-janvier-2017-une-avancee-majeure-pour-lopen-data.

La base sirene sera disponible en opendata à partir de janvier
prochain. Elle contient les informations que possède l'INSEE sur les
entreprises françaises et les services publics. On pourrait imaginer
s'en servir pour améliorer les données concernant ces établissements. On
trouve dans ces données le nom et l'adresse de l'établissement (on peut
espérer que leurs adresses ne soient pas toutes des CEDEX), ce qui
pourrait par exemple être intégré à osmose pour proposer des
entreprises manquantes.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr