19 apr 2013 kl. 18:03 skrev Joakim Fors:

> Karl Wettin (kalle på #OSM.se på IRC) har labbat med postnummerpolygoner. Så 
> du har inte drömt.

Precis så. Till en början har jag lagt in centroiden för alla 
ref:se:posten:postort i OSM.

Det fungerar relativt bra, men långt från perfekt. Detta beror primärt på att 
OSM innehåller felskrivna vägnamn, att det saknas väldigt många vägnamn i 
postnummersystemet som finns i OSM samt på större vägar i postnummersystemet 
som sträcker sig genom flera postorter (och alltså inte bara genom flera 
postnummer).

Joakim grävde fram SCBs postnummerpolygoner, men jag fastställde ganska snabbt 
att dessa innehåller väldigt mycket fel. Ganska mycket mer och i vissa fall 
riktigt hemska fel jämfört vad jag får fram genom att köra postnummersystemet 
mot OSM. Det får mig misstänka att man stöter på liknande problem när man 
samkör postnummersystemet mot Lantmäteriets databas. Exempelvis ligger delar av 
Getinge mitt i centrala Halmstad enligt den.

Men jag måste nog tänka om lite för att få till det här. Har börjat ändra fokus 
mot att först få fram bra postortspolygoner, vilket egentligen är precis lika 
problematiskt som att ha fokus på postnummer.  

Det krävs rätt mycket datorjuice att få fram polygonerna. För att orka med på 
min lilla laptop kör jag iterativt postort för postort, dessvärre ger det sämre 
resultat än att bearbeta allt på en gång.


Vidare är det problem med vem som äger rätt att använda sig av informationen 
från postnummersystemet. Enligt mina samtal med PTS skall Posten gratis 
tillhandahålla informationen, men samtidigt säger de att Posten äger databasen. 
Postens jurister har vid minst ett tillfälle de senaste 12 månaderna hävdat 
katalogskydd skicka "cease and desist" till en hobbysajt på nätet som 
republicerade postnummersystemet via JSON.

Som det är nu gör jag detta utan att republicera något till allmänheten och 
känner mig helt säker. Blir det någon gång i framtiden riktigt bra tror jag att 
alla parter är intresserade av det här, för OSM innehåller som sagt en hel del 
gator som saknas  i postnummersystemet och det finns en hel del data i 
postnummersystemet som kan förbättra OSM. Det luktar dock mer av 
Lantmäteriet-Metria kring Posten-Postnummerservice för varje ny berättelse jag 
hör om postnummersystemet, så det skulle inte förvåna mig om det visar sig kört 
att göra något utan att betala hundratusentals kronor (eller mer) om året.

Mitt intresse i datan är primärt för att göra en juste öppen geocoder med fokus 
på Sverige och svenska regler. Få fram riktiga postadresser, inter/extrapolera 
fram positioner till husnummer som inte finns inritade i OSM, luddigt sök 
baserat på svenska språket, etc. Men det kan ta flera år innan jag når fram 
dit, om jag nu når fram dit.
 


                kalle
_______________________________________________
Talk-se mailing list
Talk-se@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-se

Till