19 apr 2013 kl. 18:03 skrev Joakim Fors:
> Karl Wettin (kalle på #OSM.se på IRC) har labbat med postnummerpolygoner. Så
> du har inte drömt.
Precis så. Till en början har jag lagt in centroiden för alla
ref:se:posten:postort i OSM.
Det fungerar relativt bra, men långt från perfekt. Detta beror primärt på att
OSM innehåller felskrivna vägnamn, att det saknas väldigt många vägnamn i
postnummersystemet som finns i OSM samt på större vägar i postnummersystemet
som sträcker sig genom flera postorter (och alltså inte bara genom flera
postnummer).
Joakim grävde fram SCBs postnummerpolygoner, men jag fastställde ganska snabbt
att dessa innehåller väldigt mycket fel. Ganska mycket mer och i vissa fall
riktigt hemska fel jämfört vad jag får fram genom att köra postnummersystemet
mot OSM. Det får mig misstänka att man stöter på liknande problem när man
samkör postnummersystemet mot Lantmäteriets databas. Exempelvis ligger delar av
Getinge mitt i centrala Halmstad enligt den.
Men jag måste nog tänka om lite för att få till det här. Har börjat ändra fokus
mot att först få fram bra postortspolygoner, vilket egentligen är precis lika
problematiskt som att ha fokus på postnummer.
Det krävs rätt mycket datorjuice att få fram polygonerna. För att orka med på
min lilla laptop kör jag iterativt postort för postort, dessvärre ger det sämre
resultat än att bearbeta allt på en gång.
Vidare är det problem med vem som äger rätt att använda sig av informationen
från postnummersystemet. Enligt mina samtal med PTS skall Posten gratis
tillhandahålla informationen, men samtidigt säger de att Posten äger databasen.
Postens jurister har vid minst ett tillfälle de senaste 12 månaderna hävdat
katalogskydd skicka "cease and desist" till en hobbysajt på nätet som
republicerade postnummersystemet via JSON.
Som det är nu gör jag detta utan att republicera något till allmänheten och
känner mig helt säker. Blir det någon gång i framtiden riktigt bra tror jag att
alla parter är intresserade av det här, för OSM innehåller som sagt en hel del
gator som saknas i postnummersystemet och det finns en hel del data i
postnummersystemet som kan förbättra OSM. Det luktar dock mer av
Lantmäteriet-Metria kring Posten-Postnummerservice för varje ny berättelse jag
hör om postnummersystemet, så det skulle inte förvåna mig om det visar sig kört
att göra något utan att betala hundratusentals kronor (eller mer) om året.
Mitt intresse i datan är primärt för att göra en juste öppen geocoder med fokus
på Sverige och svenska regler. Få fram riktiga postadresser, inter/extrapolera
fram positioner till husnummer som inte finns inritade i OSM, luddigt sök
baserat på svenska språket, etc. Men det kan ta flera år innan jag når fram
dit, om jag nu når fram dit.
kalle
_______________________________________________
Talk-se mailing list
Talk-se@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-se