On voit également des erreurs dans certains CSV, comme code_cadastre.csv
avec cette ligne:
  14,014,VILLIERS-L,SEC (,8B757,VECT
au lieu de
  14,014,VILLIERS-LE-SEC,14???,8B757,VECT
avec un champ (14???) manquant

D'autres champs CSV sont incorrectement interprétés comme des nombres en
format exponentiel (exemple: "4E036" qui devient 4,00E+36 une fois converti)

Là encore les guillemets régleraient ces défauts. Je pense que ces CSV (et
tant qu'à faire les autres fichiers aussi) devraient être tous vérifiés en
tentant de les charger pour trouver ces défauts venant de bogues de l'outil
"maison" d'export utilisé pour les produire.


<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
Garanti
sans virus. www.avast.com
<https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
<#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

Le 18 mars 2017 à 16:44, Philippe Verdy <verd...@wanadoo.fr> a écrit :

> Sinon les fichiers CSV de la BANO contiennent des parasites qui
> compliquent leur utilisation. Les champs sont séparés par des virgules ","
> mais on trouve aussi des point-virgules avec des caractères sous forme
> d'entité numériques (comme "&#39;" pour les apostrophes ASCII). En format
> CSV ces entités numériques (pour HTML ou XML) n'ont rien à faire là (pas
> plus non plus en format JSON).
>
> Si on charge ces CSV dans Excel (qui par défaut en version française
> recherche les point-virgules, certaines lignes seront découpées sur
> plusieurs cellules, tout le reste restant dans la 1re colonne, et si on
> essaye de convertir les séparateurs en cellules séparées en rpenant la
> virule, Excel signale que cela va écraser des cellules déja remplies
> contenant les morceaux découpés.
>
> Il serait bon que les CSV (comme JSON) utilisent systématiquement des
> "guillemets" pour délimiter tous les champs (s'il y a des guillemets dans
> les chaines, on doit les doubler) et n'utilise sinon aucune entité
> numérique ou nommée pour les caractères. Dès lors plus de problème si les
> séparateurs sont des virgules, des point-virgules ou autre chose (des
> tabulations)... y compris pour les champs contenant des codes comme par
> exemple les numéros de départements dont la plupart seront interprétés
> comme des nombres (avec leur zéro initial tronqué) mais pas tous
> (départements de la Corse), et les numéros de communes à 3 chiffres.
>
>
> Le 18 mars 2017 à 16:30, Philippe Verdy <verd...@wanadoo.fr> a écrit :
>
>> Tu veux dire que c'est une erreur ?
>> Que doit signifier ce "citycode": un code INSEE, un code IRIS ? un code
>> postal géographique, un code postal spécial (type CEDEX) ?
>> Dans ce cas comment faire si des zones se superposent ou si la rue
>> signalée est coupée en plusieurs parties avec des codes différents et si la
>> BAN ne sait pas faire la distinction sur une adresse donnée ou si certaines
>> adresses postales dans la rue ont des codes différents ?
>>
>> De plus la page wiki
>>   https://wiki.openstreetmap.org/wiki/WikiProject_France/WikiP
>> roject_Base_Adresses_Nationale_Ouverte_(BANO)
>> mentionne l'URL "http://bano.openstreetmap.fr/data/"; pour les données
>> par département (formats .shp.zip et .csv)
>> mais pas l'URL "http://bano.openstreetmap.fr/BAN_odbl/"; (formats
>> .json.bz2 et .csv.bz2)
>> Lesquelles sont la BAN et la BANO, ou bien si les deux sont la BANO, y
>> a-t-il une différence hormi le format (je vois les deux dossiers
>> synchronisés à peu près en même temps pour chaque département) ?
>>
>>
>>
>>
>>
>> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
>>  Garanti
>> sans virus. www.avast.com
>> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
>> <#m_-8754549339081679551_m_9114398251918493076_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>>
>> Le 18 mars 2017 à 15:31, Brice MALLET <brice...@free.fr> a écrit :
>>
>>> Bonjour, je ne me souviens plus s'il existe une liste technique BANO.
>>>
>>> En effet nous (www.entrouvert.com) suivons ce projet à titre
>>> professionnel et l'un de mes collègues a détecté une modification dans
>>> l'export json accessible depuis OSM.fr (http://bano.openstreetmap.fr/
>>> BAN_odbl/).
>>>
>>> citycode est désormais une liste :
>>>
>>>   {"city": "Paris",
>>>    "citycode": ["75113", 75056],
>>>    "name": "Allée Marc Chagall",
>>>    ...
>>>
>>> La question est donc : quelle liste ou autre canal suivre pour être
>>> informé de ces évolutions ?
>>> Merci.
>>>
>>>
>>> --
>>> Cordialement
>>>
>>> Brice Mallet
>>>
>>> _______________________________________________
>>> Talk-fr mailing list
>>> Talk-fr@openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-fr
>>>
>>
>>
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à