Den 28. sep. 2014 23:54, Ruben Undheim skreiv: > Hei, > > addrnodeimport-programmet bruker nå en liste over skrivefeil i > Kartverkets data når den genererer opplysninger: > https://github.com/rubund/addrnodeimport/blob/master/xml/corrections.xml > > Dette har spesielt økt prosenten vist for Kautokeino og Karasjok på > http://osm.beebeetle.com/addrnodeimportstatus.php
Det er litt mistenklig liste. Det ser ut som feil med tegnsettet. SOSI filene frå Kartverket kjem i ISO-8859-10 som standard, dette er eit teiknsett som inneholder samiske teikn. Sosi2osm konverterer dette til UTF-8 som er brukt i XML formatet til OSM. Det virkar som om ein eller annan plass blir namna konvertert til ASCII og ukjende teikn erstatta med ?. Kan du dobbeltskjekke at sosi2osm gir UTF-8 filer med korekte samiske teikn, og at python koden har det korrekte teiknsettet satt over alt? Knut _______________________________________________ kart mailing list [email protected] http://lists.nuug.no/mailman/listinfo/kart
