on. den 11. 06. 2014 klokka 20.28 (+0200) skreiv Karl Ove Hufthammer: > Her kjem ikkje Elveg så bra ut.
Har testa litt meir. Eg kjenner ikkje til SOSI-standarden, så er det nokon som veit om det der på nokon måte er markert namn som er uoffisielle og ikkje bør brukast? (Eg brukar som nemnt berre grep på GATENAVN, utan noka filtrering.) Eg finn nemleg ganske rare gate-/vegnamn: > # For Kautokeino > fgrep '?' 2011*.SOS | uniq 2011Adresser.SOS:...GATENAVN "Loa?kodievvá" 2011Adresser.SOS:...GATENAVN "Loa?kosáttu" 2011Adresser.SOS:...GATENAVN "?orru" 2011Adresser.SOS:...GATENAVN "Áv??iluodda" 2011Adresser.SOS:...GATENAVN "Gartnetva??a" 2011Adresser.SOS:...GATENAVN "?uonjaluodda" 2011Adresser.SOS:...GATENAVN "Áv??iluodda" 2011Adresser.SOS:...GATENAVN "Loa?kosáttu" 2011Adresser.SOS:...GATENAVN "Jok?aluodda" 2011Adresser.SOS:...GATENAVN "Gea?genjunni" 2011Adresser.SOS:...GATENAVN "Áv??iluodda" 2011Elveg.SOS:..GATENAVN "Loa?kodievvá" 2011Elveg.SOS:..GATENAVN "Loa?kosáttu" 2011Elveg.SOS:..GATENAVN "?orru" 2011Elveg.SOS:..GATENAVN "Gartnetva??a" 2011Elveg.SOS:..GATENAVN "?uonjaluodda" 2011Elveg.SOS:..GATENAVN "Jok?aluodda" 2011Elveg.SOS:..GATENAVN "Loa?kosáttu" 2011Elveg.SOS:..GATENAVN "Jok?aluodda" Er altså samiske namn, men dei inneheld spørsmålsteikn, og er altså ugyldige. Noko som har gått gale med teiknkodings- konvertering hos Kartverket ein gong? Og ja, dette er faktiske spørsmålsteikn, ikkje teiknkodingsproblem på mi side. (Sidan eg køyrer UTF-8-system, brukte eg kommandoen iconv --from=cp1252 --to=utf8 før eg limte inn i e-posten.) Ei lita åtvaring om teiknkodingsproblem til slutt. *Ikkje* bruk programmet «recode» på filene. Det inneheld (i versjon 3.6 og tidlegare) ein stygg feil der teikn 0x9E og 0x8F er bytt om. Dette er retta i betaversjonen av 3.7. iconv fungerer derimot rett. Enkel test: echo $'---\x9E---' | recode windows1252..utf8 # Skal vera ž echo $'---\x8E---' | recode windows1252..utf8 # Skal vera Ž echo $'---\x8F---' | recode windows1252..utf8 # Skal vera tom echo $'---\x9E---' | iconv --from=cp1252 --to=utf8 # Skal vera ž echo $'---\x8E---' | iconv --from=cp1252 --to=utf8 # Skal vera Ž echo $'---\x8F---' | iconv --from=cp1252 --to=utf8 # Skal vera tom -- Karl Ove Hufthammer http://huftis.org/ Jabber: [email protected] _______________________________________________ kart mailing list [email protected] http://lists.nuug.no/mailman/listinfo/kart
