Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-30 Par sujet laurent-38
Bonjour,

Parfois le rayon de recherche - 50 m - est un peu court, voir par exemple
https://osmose.openstreetmap.fr/fr/error/30194469001, déjà cartographié par
https://www.openstreetmap.org/node/5226936783 .

Distance entre le signalement et la boutique cartographiée : 120m.

Je présume qu’augmenter le rayon de recherche risque d’augmenter les fausses
correspondances et ainsi de rater des signalements pertinents.

Mais si je rajoute le code ref:FR:SIRET sur la boutique cartographiée,
est-ce que cela peut permettre d’éviter ce signalement erroné ? (est-ce que
le rapprochement peut se faire sur un plus grand rayon lorsque le SIRET est
renseigné ?)

Cordialement
~~
laurent 





--
Sent from: http://gis.19327.n8.nabble.com/France-f5380434.html

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet Frédéric Rodrigo

Le 30/07/2019 à 00:29, ph...@phyks.me a écrit :
> Il s'agit d'un entrepreneur individuel... à filtrer globalement de 
mon point de vue car cela génère bien trop de bruit.


Ne pourrait-on pas filtrer par type d'activités ? Sinon on va perdre 
toutes les professions libérales de santé qui avaient l'air très 
intéressante à récupérer par SIREN (mais peut être qu'il y a d'autres 
bases exploitables) ?


C'est le seul cas d'entreprises individuel pour lesquelles je vois un 
intérêt pour l'instant. 


C'est déjà un filtre par activité.

Seule les activées avec "trancheEffectifs" présent sont filtrées sur 
l'effectif.


https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json

Après il ne doit pas rester trop de professions libérales, on en a 
beaucoup retirer.


Pour la santé il y a également la base FINESS, déjà dans Osmose.


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet phyks
> Il s'agit d'un entrepreneur individuel... à filtrer globalement de mon point 
> de vue car cela génère bien trop de bruit.

Ne pourrait-on pas filtrer par type d'activités ? Sinon on va perdre toutes les 
professions libérales de santé qui avaient l'air très intéressante à récupérer 
par SIREN (mais peut être qu'il y a d'autres bases exploitables) ?

C'est le seul cas d'entreprises individuel pour lesquelles je vois un intérêt 
pour l'instant. 

Le 29 juillet 2019 18:06:16 UTC+02:00, Christian Quest 
 a écrit :
>Le lun. 29 juil. 2019 à 16:07, Phyks  a écrit :
>
>> Salut Fred,
>>
>> Quelques remontées de plus sur Sirene :
>>
>> 1. J'ai des entreprises radiées qui apparaissent. Par exemple,
>> https://osmose.openstreetmap.fr/fr/error/30133361229 mais qui a été
>> radiée en mars 2019 normalement :
>> https://www.societe.com/societe/les-p-tites-pupilles-789829991.html.
>> Peut être que ça vient des données sources qui ne sont pas assez
>> fraîches ceci dit.
>>
>>
>Là aussi WARNING... l'INSEE diffuse désormais toutes les entreprise (et
>leurs établissements), actifs ou non (radié, etc).
>Je ne sais pas si l'analyse osmose prends bien ça en compte dans les
>données source.
>
>Pour le cas présent l'entreprise est toujours active d'après l'INSEE:
>https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.siren=789829991=00015
>
>Attention, radié d'un greffe ne veut pas dire que l'entreprise n'existe
>plus, elle est peut être rattachée à un autre greffe ;)
>Oui, c'est le bazar et difficile de s'y retrouver !
>
>2. J'ai des rapprochements non faits liés au type de POI:
>> - https://osmose.openstreetmap.fr/fr/error/30133356361 annoté
>> dans OSM
>> comme un shop=deli.
>> - https://osmose.openstreetmap.fr/fr/error/30133363991 annoté
>> dans OSM
>> comme un amenity=restaurant.
>>
>> 3. J'ai des hôtels qui apparaissent qui n'en sont pas (société accolé
>à
>> un Airbnb ?), par exemple
>> https://osmose.openstreetmap.fr/fr/error/30133362002. Le site SIRENE
>> (
>>
>https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.nic=00020=432216802
>> )
>> donne un effectif nul. Peut être qu'on peut les filtrer comme ça ?
>>
>>
>Il s'agit d'un entrepreneur individuel... à filtrer globalement de mon
>point de vue car cela génère bien trop de bruit.
>
>
>4. J'ai une agence de voyage qui est en fait le siège de MSC Croisière
>> (https://osmose.openstreetmap.fr/fr/error/30133364947). Pas trop
>d'idées
>> pour filtrer ça, à part peut être en ayant des valeurs "typiques"
>> d'effectifs pour différents types de POIs (shop=travel_agency avec >
>100
>> personnes est sûrement louche).
>>
>> 5. J'ai des sociétés qui ont été liquidées qui apparaissent
>> (https://osmose.openstreetmap.fr/fr/error/30133364905 par exemple, cf
>> https://www.societe.com/societe/croisiere-jaune-441382231.html), je
>ne
>> sais pas trop si ça peut être filtré.
>>
>>
>C'est SIRENE qui n'est pas à jour... indiquée comme "actif"
>
>
>6. social_facility=assisted_living devrait être en synonyme de
>> social_facility=group_home, cf
>> https://osmose.openstreetmap.fr/fr/error/3013339 et
>> https://www.openstreetmap.org/way/83234566.
>>
>>
>> C'est ce que je vois de plus évident pour l'instant et responsable
>d'une
>> bonne majorité de faux positifs. Je pourrais jeter un œil plus dans
>le
>> détail.
>>
>>
>-- 
>Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet Frédéric Rodrigo

Le 29/07/2019 à 18:06, Christian Quest a écrit :



Le lun. 29 juil. 2019 à 16:07, Phyks > a écrit :


Salut Fred,

Quelques remontées de plus sur Sirene :

1. J'ai des entreprises radiées qui apparaissent. Par exemple,
https://osmose.openstreetmap.fr/fr/error/30133361229 mais qui a été
radiée en mars 2019 normalement :
https://www.societe.com/societe/les-p-tites-pupilles-789829991.html.
Peut être que ça vient des données sources qui ne sont pas assez
fraîches ceci dit.


Là aussi WARNING... l'INSEE diffuse désormais toutes les entreprise 
(et leurs établissements), actifs ou non (radié, etc).
Je ne sais pas si l'analyse osmose prends bien ça en compte dans les 
données source.


Pour le cas présent l'entreprise est toujours active d'après l'INSEE: 
https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.siren=789829991=00015


Attention, radié d'un greffe ne veut pas dire que l'entreprise 
n'existe plus, elle est peut être rattachée à un autre greffe ;)

Oui, c'est le bazar et difficile de s'y retrouver !



Normalement c'est bon. On ne garde que les etatAdministratifEtablissement=A




2. J'ai des rapprochements non faits liés au type de POI:
        - https://osmose.openstreetmap.fr/fr/error/30133356361
annoté dans OSM
comme un shop=deli.

47.21Z, Commerce de détail de fruits et légumes en magasin spécialisé 
non intégré


Ok. j'ajoute shop=deli

https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json#L194



        - https://osmose.openstreetmap.fr/fr/error/30133363991
annoté dans OSM
comme un amenity=restaurant.


Oui j'ai déjà vu le problème. Il faire comme si restaurant=fast_food




3. J'ai des hôtels qui apparaissent qui n'en sont pas (société
accolé à
un Airbnb ?), par exemple
https://osmose.openstreetmap.fr/fr/error/30133362002. Le site SIRENE

(https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.nic=00020=432216802)
donne un effectif nul. Peut être qu'on peut les filtrer comme ça ?


Il s'agit d'un entrepreneur individuel... à filtrer globalement de mon 
point de vue car cela génère bien trop de bruit.


55.10Z, Hôtels et hébergement similaire non intégré

Ok à filtrer sur trancheEffectifs.





4. J'ai une agence de voyage qui est en fait le siège de MSC Croisière
(https://osmose.openstreetmap.fr/fr/error/30133364947). Pas trop
d'idées
pour filtrer ça, à part peut être en ayant des valeurs "typiques"
d'effectifs pour différents types de POIs (shop=travel_agency avec
> 100
personnes est sûrement louche).

Oui, je connais le problème. Mais vraiment d'idée pour filtrer -> 
faux-positif





5. J'ai des sociétés qui ont été liquidées qui apparaissent
(https://osmose.openstreetmap.fr/fr/error/30133364905 par exemple, cf
https://www.societe.com/societe/croisiere-jaune-441382231.html), je ne
sais pas trop si ça peut être filtré.


C'est SIRENE qui n'est pas à jour... indiquée comme "actif"


6. social_facility=assisted_living devrait être en synonyme de
social_facility=group_home, cf
https://osmose.openstreetmap.fr/fr/error/3013339 et
https://www.openstreetmap.org/way/83234566.


C'est ce que je vois de plus évident pour l'instant et responsable
d'une
bonne majorité de faux positifs. Je pourrais jeter un œil plus dans le
détail.


À ton avis pour tous les cas, c'est détaillé ?

https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json#L863-L938



J'ai reporté les choses à modifier sur github :

https://github.com/osm-fr/osmose-backend/pull/338


Frédéric.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet Christian Quest
Le lun. 29 juil. 2019 à 16:07, Phyks  a écrit :

> Salut Fred,
>
> Quelques remontées de plus sur Sirene :
>
> 1. J'ai des entreprises radiées qui apparaissent. Par exemple,
> https://osmose.openstreetmap.fr/fr/error/30133361229 mais qui a été
> radiée en mars 2019 normalement :
> https://www.societe.com/societe/les-p-tites-pupilles-789829991.html.
> Peut être que ça vient des données sources qui ne sont pas assez
> fraîches ceci dit.
>
>
Là aussi WARNING... l'INSEE diffuse désormais toutes les entreprise (et
leurs établissements), actifs ou non (radié, etc).
Je ne sais pas si l'analyse osmose prends bien ça en compte dans les
données source.

Pour le cas présent l'entreprise est toujours active d'après l'INSEE:
https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.siren=789829991=00015

Attention, radié d'un greffe ne veut pas dire que l'entreprise n'existe
plus, elle est peut être rattachée à un autre greffe ;)
Oui, c'est le bazar et difficile de s'y retrouver !

2. J'ai des rapprochements non faits liés au type de POI:
> - https://osmose.openstreetmap.fr/fr/error/30133356361 annoté
> dans OSM
> comme un shop=deli.
> - https://osmose.openstreetmap.fr/fr/error/30133363991 annoté
> dans OSM
> comme un amenity=restaurant.
>
> 3. J'ai des hôtels qui apparaissent qui n'en sont pas (société accolé à
> un Airbnb ?), par exemple
> https://osmose.openstreetmap.fr/fr/error/30133362002. Le site SIRENE
> (
> https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.nic=00020=432216802
> )
> donne un effectif nul. Peut être qu'on peut les filtrer comme ça ?
>
>
Il s'agit d'un entrepreneur individuel... à filtrer globalement de mon
point de vue car cela génère bien trop de bruit.


4. J'ai une agence de voyage qui est en fait le siège de MSC Croisière
> (https://osmose.openstreetmap.fr/fr/error/30133364947). Pas trop d'idées
> pour filtrer ça, à part peut être en ayant des valeurs "typiques"
> d'effectifs pour différents types de POIs (shop=travel_agency avec > 100
> personnes est sûrement louche).
>
> 5. J'ai des sociétés qui ont été liquidées qui apparaissent
> (https://osmose.openstreetmap.fr/fr/error/30133364905 par exemple, cf
> https://www.societe.com/societe/croisiere-jaune-441382231.html), je ne
> sais pas trop si ça peut être filtré.
>
>
C'est SIRENE qui n'est pas à jour... indiquée comme "actif"


6. social_facility=assisted_living devrait être en synonyme de
> social_facility=group_home, cf
> https://osmose.openstreetmap.fr/fr/error/3013339 et
> https://www.openstreetmap.org/way/83234566.
>
>
> C'est ce que je vois de plus évident pour l'instant et responsable d'une
> bonne majorité de faux positifs. Je pourrais jeter un œil plus dans le
> détail.
>
>
-- 
Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet Phyks
Salut Fred,

Quelques remontées de plus sur Sirene :

1. J'ai des entreprises radiées qui apparaissent. Par exemple,
https://osmose.openstreetmap.fr/fr/error/30133361229 mais qui a été
radiée en mars 2019 normalement :
https://www.societe.com/societe/les-p-tites-pupilles-789829991.html.
Peut être que ça vient des données sources qui ne sont pas assez
fraîches ceci dit.

2. J'ai des rapprochements non faits liés au type de POI:
- https://osmose.openstreetmap.fr/fr/error/30133356361 annoté dans OSM
comme un shop=deli.
- https://osmose.openstreetmap.fr/fr/error/30133363991 annoté dans OSM
comme un amenity=restaurant.

3. J'ai des hôtels qui apparaissent qui n'en sont pas (société accolé à
un Airbnb ?), par exemple
https://osmose.openstreetmap.fr/fr/error/30133362002. Le site SIRENE
(https://avis-situation-sirene.insee.fr/ListeSiretToEtab.action?form.nic=00020=432216802)
donne un effectif nul. Peut être qu'on peut les filtrer comme ça ?

4. J'ai une agence de voyage qui est en fait le siège de MSC Croisière
(https://osmose.openstreetmap.fr/fr/error/30133364947). Pas trop d'idées
pour filtrer ça, à part peut être en ayant des valeurs "typiques"
d'effectifs pour différents types de POIs (shop=travel_agency avec > 100
personnes est sûrement louche).

5. J'ai des sociétés qui ont été liquidées qui apparaissent
(https://osmose.openstreetmap.fr/fr/error/30133364905 par exemple, cf
https://www.societe.com/societe/croisiere-jaune-441382231.html), je ne
sais pas trop si ça peut être filtré.

6. social_facility=assisted_living devrait être en synonyme de
social_facility=group_home, cf
https://osmose.openstreetmap.fr/fr/error/3013339 et
https://www.openstreetmap.org/way/83234566.


C'est ce que je vois de plus évident pour l'instant et responsable d'une
bonne majorité de faux positifs. Je pourrais jeter un œil plus dans le
détail.

Bonne journée,
-- 
Phyks

Le 21/07/2019 à 01:10, Frédéric Rodrigo a écrit :
> Le 20/07/2019 à 19:13, Phyks a écrit :
>> Salut,
>>
>> J'ai jeté un œil à Montrouge, il y avait pas mal de faux positifs,
>> principalement des entreprises individuelles positionnées sur
>> l'habitation du propriétaire
> 
> Pour l'instant il n'y a que quelque types d'activités pour les quelles
> les entreprises individuelles sont ignorées.
> 
> On peut le généraliser.
> 
> Des avis sur la question sont bien venu.
> 
> 
>> ou avec des tags proches non trouvés
>> (restaurants / bars notamment).
> 
> Il faut remonter ça pour améliorer le mapping, et avoir moins de faux
> positifs.
> 
> https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json
> 
> 
> 
>> Il y a pas beaucoup de choses intéressantes une fois ceci filtré,
>> notamment pour les professions libérales (dentistes etc).
>>
>> Deux remarques sur la forme :
>>
>> * dans le frontend, le numéro SIRET est cliquable mais renvoie
>> systématiquement vers une page d'erreur. Ce n'est pas le plus pratique,
>> et j'avais toujours un autre onglet pour chercher les SIRET du coup.
> 
> Normalement c'est déjà corrigé depuis mercredi. Il peut en manquer mais
> ça en trouve aussi.
> 
> 
>> * serait-il possible de systématiquement afficher le nom de l'entreprise
>> dans les erreurs dans le frontend Osmose ? On pourrait économiser
>> quelques clics / recherches sur le SIRET comme ça.
> 
> Quand il y un nom c'est affiché.
> 
> 

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-29 Par sujet Christian Quest
Ah... tout s'eplique  :)

La base SIRENE contient deux types de structures, diffusés dans 2 fichiers
différents:
- les "unités légales", c'est à dire la personne morale, l'entreprise...
qui n'a pas de localisation particulière sauf, son siège...
- les "établissements", qui sont liés à une adresse où se situe l'activité,
ils sont donc géocodables et géocodés, et l'un de ces établissement est le
siège de l'unité légale

Les établissements n'ont pas forcément de nom, le nom à reprendre est celui
de l'unité légale.

Dans les fichiers géocodés, il n'y a que les établissements, pas les unités
légales, donc pas les noms des entreprises.
Une copie des unités légales (non modifiées) est dispo dans
http://data.cquest.org/geo_sirene/v2019/archives/


Le lun. 22 juil. 2019 à 16:07, Frédéric Rodrigo  a
écrit :

> Le 22/07/2019 à 16:00, Vincent Bergeot a écrit :
> > Le 22/07/2019 à 15:23, osm.sanspourr...@spamgourmet.com a écrit :
> > * serait-il possible de systématiquement afficher le nom de
> l'entreprise
> > dans les erreurs dans le frontend Osmose ? On pourrait économiser
> > quelques clics / recherches sur le SIRET comme ça.
>  Quand il y un nom c'est affiché.
> >>> Par exemple,https://osmose.openstreetmap.fr/fr/error/29754498711  n'a
> >>> aucun nom affiché dans l'erreur. Pourtant, chez societe.com (par
> >>> exemple), il y a un nom
> >>> https://www.societe.com/etablissement/bluebretzel-49172436500029.html.
> >> Fred parle bien sûr des noms figurant dans la base SIRENE. Si tu as une
> source publique et gratuite pour trouver le nom à partir du code SIREN, il
> devrait être partant.
> >> Societe.com, tu peux l'utiliser pour vérifier à titre individuel. Par
> contre pour être utilisé directement par Osmose c'est une autre histoire.
> >
> > ll doit y avoir un "bug" quelque part car le nom se trouve bien sur
> > https://entreprise.data.gouv.fr/etablissement/49172436500029 qui
> > semble être aussi basé sur la SIRENE (mais peut-être pas les mêmes
> > versions ? je ne connais pas bien donc je ne sais pas trop).
> >
> > my2cents
> >
>
> Les données utilisées par Osmose sont celles-là :
>
> http://data.cquest.org/geo_sirene/v2019/last/dep/
>
>
> Je ne sais pas quels traitement sont fait dessus par Christian.
>
>
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>


-- 
Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-22 Par sujet Frédéric Rodrigo

Le 22/07/2019 à 16:00, Vincent Bergeot a écrit :

Le 22/07/2019 à 15:23, osm.sanspourr...@spamgourmet.com a écrit :

* serait-il possible de systématiquement afficher le nom de l'entreprise
dans les erreurs dans le frontend Osmose ? On pourrait économiser
quelques clics / recherches sur le SIRET comme ça.

Quand il y un nom c'est affiché.

Par exemple,https://osmose.openstreetmap.fr/fr/error/29754498711  n'a
aucun nom affiché dans l'erreur. Pourtant, chez societe.com (par
exemple), il y a un nom
https://www.societe.com/etablissement/bluebretzel-49172436500029.html.

Fred parle bien sûr des noms figurant dans la base SIRENE. Si tu as une source 
publique et gratuite pour trouver le nom à partir du code SIREN, il devrait 
être partant.
Societe.com, tu peux l'utiliser pour vérifier à titre individuel. Par contre 
pour être utilisé directement par Osmose c'est une autre histoire.


ll doit y avoir un "bug" quelque part car le nom se trouve bien sur 
https://entreprise.data.gouv.fr/etablissement/49172436500029 qui 
semble être aussi basé sur la SIRENE (mais peut-être pas les mêmes 
versions ? je ne connais pas bien donc je ne sais pas trop).


my2cents



Les données utilisées par Osmose sont celles-là :

http://data.cquest.org/geo_sirene/v2019/last/dep/


Je ne sais pas quels traitement sont fait dessus par Christian.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-22 Par sujet osm . sanspourriel
> Gesendet: Sonntag, 21. Juli 2019 um 20:10 Uhr
> Von: "Phyks - ph...@phyks.me"
> Betreff: Re: [OSM-talk-fr]  Demande de retours sur l'analyse Osmose 
> d'intégration de la base Sirene
> > […]
> > Il faut remonter ça pour améliorer le mapping, et avoir moins de faux 
> > positifs.
> 
> Ce n'est pas remonté quelque part quand on clique sur le bouton "faux positif"
Oui si Fred analyse ça derrière mais là il propose que chacun essaye (aussi) 
d'analyser.

> >> * serait-il possible de systématiquement afficher le nom de l'entreprise
> >> dans les erreurs dans le frontend Osmose ? On pourrait économiser
> >> quelques clics / recherches sur le SIRET comme ça.
> > 
> > Quand il y un nom c'est affiché.
> 
> Par exemple, https://osmose.openstreetmap.fr/fr/error/29754498711 n'a
> aucun nom affiché dans l'erreur. Pourtant, chez societe.com (par
> exemple), il y a un nom
> https://www.societe.com/etablissement/bluebretzel-49172436500029.html.

Fred parle bien sûr des noms figurant dans la base SIRENE. Si tu as une source 
publique et gratuite pour trouver le nom à partir du code SIREN, il devrait 
être partant.
Societe.com, tu peux l'utiliser pour vérifier à titre individuel. Par contre 
pour être utilisé directement par Osmose c'est une autre histoire.

Jean-Yvon


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-21 Par sujet Phyks
> Des avis sur la question sont bien venu.
> 
> […]
>
> Il faut remonter ça pour améliorer le mapping, et avoir moins de faux
> positifs.

Ce n'est pas remonté quelque part quand on clique sur le bouton "faux
positif" ?

Au passage, je viens de voir que tous les faux positifs que j'avais
marqué sont réapparus… Est-ce normal ?

>> Il y a pas beaucoup de choses intéressantes une fois ceci filtré,
>> notamment pour les professions libérales (dentistes etc).
>>
>> Deux remarques sur la forme :
>>
>> * dans le frontend, le numéro SIRET est cliquable mais renvoie
>> systématiquement vers une page d'erreur. Ce n'est pas le plus pratique,
>> et j'avais toujours un autre onglet pour chercher les SIRET du coup.
> 
> Normalement c'est déjà corrigé depuis mercredi. Il peut en manquer mais
> ça en trouve aussi.

Je confirme, super !

>> * serait-il possible de systématiquement afficher le nom de l'entreprise
>> dans les erreurs dans le frontend Osmose ? On pourrait économiser
>> quelques clics / recherches sur le SIRET comme ça.
> 
> Quand il y un nom c'est affiché.

Par exemple, https://osmose.openstreetmap.fr/fr/error/29754498711 n'a
aucun nom affiché dans l'erreur. Pourtant, chez societe.com (par
exemple), il y a un nom
https://www.societe.com/etablissement/bluebretzel-49172436500029.html.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-20 Par sujet Frédéric Rodrigo

Le 20/07/2019 à 19:13, Phyks a écrit :

Salut,

J'ai jeté un œil à Montrouge, il y avait pas mal de faux positifs,
principalement des entreprises individuelles positionnées sur
l'habitation du propriétaire


Pour l'instant il n'y a que quelque types d'activités pour les quelles 
les entreprises individuelles sont ignorées.


On peut le généraliser.

Des avis sur la question sont bien venu.



ou avec des tags proches non trouvés
(restaurants / bars notamment).


Il faut remonter ça pour améliorer le mapping, et avoir moins de faux 
positifs.


https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json



Il y a pas beaucoup de choses intéressantes une fois ceci filtré,
notamment pour les professions libérales (dentistes etc).

Deux remarques sur la forme :

* dans le frontend, le numéro SIRET est cliquable mais renvoie
systématiquement vers une page d'erreur. Ce n'est pas le plus pratique,
et j'avais toujours un autre onglet pour chercher les SIRET du coup.


Normalement c'est déjà corrigé depuis mercredi. Il peut en manquer mais 
ça en trouve aussi.




* serait-il possible de systématiquement afficher le nom de l'entreprise
dans les erreurs dans le frontend Osmose ? On pourrait économiser
quelques clics / recherches sur le SIRET comme ça.


Quand il y un nom c'est affiché.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-20 Par sujet Phyks
Salut,

J'ai jeté un œil à Montrouge, il y avait pas mal de faux positifs,
principalement des entreprises individuelles positionnées sur
l'habitation du propriétaire ou avec des tags proches non trouvés
(restaurants / bars notamment). J'ai tout signalé en tant que "faux
positif" dans Osmose.

Il y a pas beaucoup de choses intéressantes une fois ceci filtré,
notamment pour les professions libérales (dentistes etc).

Deux remarques sur la forme :

* dans le frontend, le numéro SIRET est cliquable mais renvoie
systématiquement vers une page d'erreur. Ce n'est pas le plus pratique,
et j'avais toujours un autre onglet pour chercher les SIRET du coup.

* serait-il possible de systématiquement afficher le nom de l'entreprise
dans les erreurs dans le frontend Osmose ? On pourrait économiser
quelques clics / recherches sur le SIRET comme ça.

Merci !
-- 
Phyks

Le 20/07/2019 à 15:12, Frédéric Rodrigo a écrit :
> Si mais comme c'est des items cachés, ça bugue sur quelques trucs.
> 
> Sur la carte change le sélecteur de sévérité à Tous, puis reviens sur la
> carte depuis le lien.
> 
> http://osmose.openstreetmap.fr/fr/map/#item==all=15=44.82189=-0.5796=1%2C2%2C3==
> 
> 
> 
> 
> Le 20/07/2019 à 14:19, Stéphane Péneau a écrit :
>> Salut,
>>
>> J'avais réussi à afficher tout ça sur la carte il y a quelques
>> semaines, mais je n'y parviens plus.
>> Le permalink ne fonctionne plus ?
>>
>> Stf
>>
>> Le 11/07/2019 à 19:51, Frédéric Rodrigo a écrit :
>>> Le 11/07/2019 à 19:20, Christian Quest a écrit :
 Content de voir que vous avez avancé sur cette GROSSE source de
 données !

 J'ai trouvé beaucoup de coiffeurs sans salon de coiffure... les
 entreprises individuelles ont-elles bien été filtrées ?
 Pareil pour les esthéticiennes... ça se pratique pas mal à domicile.
>>>
>>> Non. Pour l'instant elles y sont, sauf pour les fast_food.
>>>
>>> J'avais peur que ce soit un peu excessif de généraliser ce filtre.
>>>
>>>
>>>
 Il y a assez peu de noms, d'enseignes indiqués.

 Le SIRET n'est pas proposé/indiqué... ça serait bien pour accéder à
 la source SIRENE et vérifier le reste des infos.
>>>
>>> Oui, je vais le remettre, au moins pour ça.
>>>
>>>
>>>
>>> ___
>>> Talk-fr mailing list
>>> Talk-fr@openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>>
>>
>> ___
>> Talk-fr mailing list
>> Talk-fr@openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-fr
> 
> 
> 
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-20 Par sujet Frédéric Rodrigo

Si mais comme c'est des items cachés, ça bugue sur quelques trucs.

Sur la carte change le sélecteur de sévérité à Tous, puis reviens sur la 
carte depuis le lien.


http://osmose.openstreetmap.fr/fr/map/#item==all=15=44.82189=-0.5796=1%2C2%2C3==



Le 20/07/2019 à 14:19, Stéphane Péneau a écrit :

Salut,

J'avais réussi à afficher tout ça sur la carte il y a quelques 
semaines, mais je n'y parviens plus.

Le permalink ne fonctionne plus ?

Stf

Le 11/07/2019 à 19:51, Frédéric Rodrigo a écrit :

Le 11/07/2019 à 19:20, Christian Quest a écrit :
Content de voir que vous avez avancé sur cette GROSSE source de 
données !


J'ai trouvé beaucoup de coiffeurs sans salon de coiffure... les 
entreprises individuelles ont-elles bien été filtrées ?

Pareil pour les esthéticiennes... ça se pratique pas mal à domicile.


Non. Pour l'instant elles y sont, sauf pour les fast_food.

J'avais peur que ce soit un peu excessif de généraliser ce filtre.




Il y a assez peu de noms, d'enseignes indiqués.

Le SIRET n'est pas proposé/indiqué... ça serait bien pour accéder à 
la source SIRENE et vérifier le reste des infos.


Oui, je vais le remettre, au moins pour ça.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr




___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr




___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-20 Par sujet Stéphane Péneau

Salut,

J'avais réussi à afficher tout ça sur la carte il y a quelques semaines, 
mais je n'y parviens plus.

Le permalink ne fonctionne plus ?

Stf

Le 11/07/2019 à 19:51, Frédéric Rodrigo a écrit :

Le 11/07/2019 à 19:20, Christian Quest a écrit :
Content de voir que vous avez avancé sur cette GROSSE source de 
données !


J'ai trouvé beaucoup de coiffeurs sans salon de coiffure... les 
entreprises individuelles ont-elles bien été filtrées ?

Pareil pour les esthéticiennes... ça se pratique pas mal à domicile.


Non. Pour l'instant elles y sont, sauf pour les fast_food.

J'avais peur que ce soit un peu excessif de généraliser ce filtre.




Il y a assez peu de noms, d'enseignes indiqués.

Le SIRET n'est pas proposé/indiqué... ça serait bien pour accéder à 
la source SIRENE et vérifier le reste des infos.


Oui, je vais le remettre, au moins pour ça.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr




___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-11 Par sujet Frédéric Rodrigo

Le 11/07/2019 à 19:20, Christian Quest a écrit :

Content de voir que vous avez avancé sur cette GROSSE source de données !

J'ai trouvé beaucoup de coiffeurs sans salon de coiffure... les 
entreprises individuelles ont-elles bien été filtrées ?

Pareil pour les esthéticiennes... ça se pratique pas mal à domicile.


Non. Pour l'instant elles y sont, sauf pour les fast_food.

J'avais peur que ce soit un peu excessif de généraliser ce filtre.




Il y a assez peu de noms, d'enseignes indiqués.

Le SIRET n'est pas proposé/indiqué... ça serait bien pour accéder à la 
source SIRENE et vérifier le reste des infos.


Oui, je vais le remettre, au moins pour ça.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-11 Par sujet Christian Quest
Content de voir que vous avez avancé sur cette GROSSE source de données !

J'ai trouvé beaucoup de coiffeurs sans salon de coiffure... les entreprises
individuelles ont-elles bien été filtrées ?
Pareil pour les esthéticiennes... ça se pratique pas mal à domicile.

Il y a assez peu de noms, d'enseignes indiqués.

Le SIRET n'est pas proposé/indiqué... ça serait bien pour accéder à la
source SIRENE et vérifier le reste des infos.

-- 
Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-11 Par sujet osm . sanspourriel

Assez d'accord avec Vincent.

Sur ma commune, des commerces réellement manquants. D'autres à vérifier.
Soit sur le terrain soit sur Pages Jaunes, Societe.com.

Je dis Pages Jaunes car si la société n'existe plus l'abonnement
téléphonique aura été terminé.

Par contre j'ai un terrain de camping en plein centre ville. Je suppose
que c'est le siège social ou un ancien terrain de camping. Pas de
résultat en faisant une recherche internet.

Comme Vincent j'ai un indice : le "Terrains de camping et parcs pour
caravanes ou véhicules de loisirs non intégré" n'a pas de nom.

Donc pas mal mais comme les boîtes-aux-lettres de la Poste, c'est une
aide, pas du clic-bouton et là non plus l'imagerie aérienne n'apporte rien.

Jean-Yvon


Le 10/07/2019 à 23:22, Frédéric Rodrigo - fred.rodr...@gmail.com a écrit :

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-10 Par sujet Vincent Privat
Quelques faux positifs à Toulouse:
- un salon de beauté indiqué 2 fois dans SIRENE, de chaque côté de la rue.
L'un sans nom, l'autre correctement nommé. Le nommé est bon, l'anonyme est
faux. Je suppose que le salon a déménagé à un moment.
- un garage auto (sans nom) qui était là dans les années 80, qui a déménagé
depuis à quelques centaines de mètres.
=> Je ne vois pas trop ce qu'on peut faire sans contrôle manuel. Peut être
ne pas indiquer les entrées sans nom ?

- un commerce de type restauration rapide qui vend aussi du pain. Osmose
l'indique manquant en tant que "Boulangerie et boulangerie-pâtisserie"
(shop=bakery + name="EAT'S TIME" en majuscule). Il est présent dans OSM en
tant que "amenity=fast_food" + "name=Eat's Time".
=> Faire un rapprochement sur des tags proches sémantiquement ?
=> Faire un rapprochement sur le nom (sans être sensible à la casse) ?

Sinon globalement ça me semble plutôt pas mal en l'état, je n'ai pas encore
trouvé de truc totalement farfelu.

Le mer. 10 juil. 2019 à 23:23, Frédéric Rodrigo  a
écrit :

> Bonjour,
> On essaye de tirer quelque chose de la base SIRENE pour enrichir OSM,
> mais ce n'est pas facile.
> Il y a depuis long temps une analyse cachée pour ça sur Osmose.
> On utilise en fait la base des établissements (SIRET) géocodé par
> Christian.
> On ne garde que les résultats géocodés à l'adresse avec un score d'au
> moins 90%.
> Uniquement certains types d'activités sont conservés, celles étant
> exécutées surplace et visible depuis la rue.
> Les types d'activités sont converti vers plusieurs tags possibles dans
> OSM pour recherche une correspondance (le SIRET est pour l'instant ignoré).
> On peut aussi filtrer le type d'activité sur le nombre de salariés pour
> augmenter la probabilité que l'activé soit faire sur place.
> Le mapping des tags :
>
> https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json
> La recherche est faite à 50m.
> Le code de l'analyse :
>
> https://github.com/osm-fr/osmose-backend/blob/master/analysers/analyser_merge_shop_FR.py
>
> L'historique des échanges sur le sujet :
> https://github.com/osm-fr/osmose-backend/pull/338
> Les résultats :
> http://osmose.openstreetmap.fr/fr/errors/?item=8310=all
>
> http://osmose.openstreetmap.fr/fr/map/#item==all=14=44.92716=2.44844=1%2C2%2C3==
>
> Tous les retours sont les bien venue, les idées de filtre, les
> faux-positifs, les améliorations du mapping...
>
> Frédéric.
>
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] Demande de retours sur l'analyse Osmose d'intégration de la base Sirene

2019-07-10 Par sujet Frédéric Rodrigo

Bonjour,
On essaye de tirer quelque chose de la base SIRENE pour enrichir OSM, 
mais ce n'est pas facile.

Il y a depuis long temps une analyse cachée pour ça sur Osmose.
On utilise en fait la base des établissements (SIRET) géocodé par Christian.
On ne garde que les résultats géocodés à l'adresse avec un score d'au 
moins 90%.
Uniquement certains types d'activités sont conservés, celles étant 
exécutées surplace et visible depuis la rue.
Les types d'activités sont converti vers plusieurs tags possibles dans 
OSM pour recherche une correspondance (le SIRET est pour l'instant ignoré).
On peut aussi filtrer le type d'activité sur le nombre de salariés pour 
augmenter la probabilité que l'activé soit faire sur place.

Le mapping des tags :
https://github.com/osm-fr/osmose-backend/blob/master/merge_data/shop_FR.mapping.json
La recherche est faite à 50m.
Le code de l'analyse :
https://github.com/osm-fr/osmose-backend/blob/master/analysers/analyser_merge_shop_FR.py

L'historique des échanges sur le sujet :
https://github.com/osm-fr/osmose-backend/pull/338
Les résultats :
http://osmose.openstreetmap.fr/fr/errors/?item=8310=all
http://osmose.openstreetmap.fr/fr/map/#item==all=14=44.92716=2.44844=1%2C2%2C3==

Tous les retours sont les bien venue, les idées de filtre, les 
faux-positifs, les améliorations du mapping...


Frédéric.


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr