Hei dere! Jeg er ny til denne listen. Jeg har forsøkt å sette meg inn i hva som har blitt gjort, og hva som er status på SSR-import. Det er jo et svært datasett som bare venter på å bli importert, men fremdriften har dabbet litt av ut fra det jeg finner på nett.
Eposten min har jeg delt i tre; først nevner jeg resurssene jeg har funnet, tidligere arbeid. Deretter foreslår jeg et utgangspunkt for "destillering" av datasettet slik at vi kan begynne å matche/merge. Til slutt nevner jeg ting jeg ikke har undersøkt i dybden, men som bør avklares. ### 1. Min oppfatning av status. Jeg har funnet en relevant diskusjon fra tidligere på denne lista ( http://www.mail-archive.com/kart%40nuug.no/msg00959.html ), og en på OSM import-lista ( http://thread.gmane.org/gmane.comp.gis.openstreetmap.imports/1698/ ). https://wiki.openstreetmap.org/wiki/Import/Catalogue/Central_place_name_register_import_(Norway) er tydeligvis der viktige avgjørelser rundt import bør begrunnes og dokumenteres. På denne siden har jeg oppdatert litt om GeoJSON-formatet. Av verktøy har jeg funnet: * ssr av Thomas Hirsch (relet): https://github.com/relet/ssr Denne tar geojson-fila, og hvis forekomst og navneenhet bruker identisk navn, så søker den via OSM XAPI for å forsøke å finne matchende node/way/polygon feature i OSM. Programmet kjøres i konsoll og ber bruker hjelpe til med matching og evt velge å opprette stubb-features. * ssr2osm av Karl Ove Hufthammer (huftis): https://github.com/huftis/ssr2osm Denne tar geojson-fila og spytter ut en CSV-fil for en kommune. Den gjør også en del grep for å redusere datasettet. CSV-fila kan åpnes som et lag i JOSM for videre merging. (Har jeg oversett noen vesentlige kilder eller diskusjoner?) ### 2. Mine tanker og forslag rundt importen: Det jeg observerer er at ssr starter på utfordringen å matche og merge, imens ssr2osm starter med å "destillere" datasettet, slik at matching kan gjøres etterpå (i et annet program). Både merging og destillering er nødvendig, men jeg synes det er viktig å diskutere hvordan hver av dem skal gjøres - hvordan "dataflyten" bør være fra kartverket til OSM-noder. For å unngå skrot i OSM, så tror jeg det vil være lurt å destillere datasettet først for å finne de data som er enklest/raskest/tryggest å importere slik at man kan starte med det. Som jeg har beskrevet på wiki, og som gjort i ssr2osm, så foreslår jeg å først kaste bort alle skrivemåter der status verken er Vedtatt, Godkjent, Samlevedtatt eller Privat (http://kartverket.no/kart/stedsnavn/sentralt-stadnamnregister-ssr/saksbehandlingsstatus-for-skrivematen/). Dette luker ut ca 100k navn. Deretter kan man kaste bort skrivemåter med datofelt skr_sndato som har en dato /etter/ datasettet ble hentet (ugyldige). Bør sikkert meldes til statkart. Så kan en trekke ut skrivemåtene der objekt og skrivemåte har et 1:1 forhold. Dvs alle skrivemåter med unik objekt id (enh_ssrobj_id) og unik navneenhet id (enh_ssr_id). For disse skrivemåtene kan man i første omgang hoppe over vurderinger som: - hvilken skrivemåte skal brukes for en navneenhet (enh_ssr_id) med flere skrivemåter? Eks http://faktaark.statkart.no/SSRFakta/faktaarkfraobjektid?enhet=81473 - hvilken navneenheter skal brukes for et gitt objekt? (http://faktaark.statkart.no/SSRFakta/faktaarkfraobjektid?enhet=755532 her er det ett objekt, to navneenheter) Man sitter altså igjen med to sett, [1:1 (det enkleste)], og [1:fler (det mer vanskelige)]. Det enkleste, 1:1-settet, kan man splitte opp i fylker/kommuner og fjerne irrelevante feld fra for så å begynne å matche og merge. For dette datasettet tror jeg det er lurt å beholde feltene enh_navntype og nty_gruppenr fra det opprinnelige datasettet. På den måten slipper man å oppdatere datasettet dersom man finner feil eller regler for OSM-tagging endres, og omgjøringen til OSM-tags skjer i det aller siste leddet (matching/merging). Man kan kan enten matche via API som ssr-programmet, eller ved å konverteres til .osm eller .csv for å matche og merge i JOSM. (Personlig synes jeg det er kjekt å ha et GUI som JOSM.). ### 3. Uavklarte/uspesifiserte ting - Håndtering av flere språk for samme objekt. - Håndtering av flere objekter på samme koordinat. - Bruk av "no-kartverket-ssr:date". For å være nyttig, må den vel være den siste av alle skr_sndato (skrivemåtenes statusdato) som angår objektid'en, uavhengig av hvilken skrivemåte som er brukt? - Valg av OSM-tags. ssr og osm2ssr bruker hver sine tabeller; https://github.com/huftis/ssr2osm/blob/master/data/objekttypar.csv og https://github.com/relet/ssr/blob/master/scripts/manual.py#L48-L225 Dette er vel ryddigst å starte med på wiki. Enig? Det ble en lang epost :) Håper noen andre (fortsatt) har interessen for dette. Jeg setter pris på tilbakemeldinger. Mvh Andreas. Kongsberg. _______________________________________________ kart mailing list [email protected] http://lists.nuug.no/mailman/listinfo/kart
