Hej! Låt mig svara på några kommentarer som samlats i tråden under några dagar. Jag ämnar också skicka ett mejl till med mina framsteg/bakslag men databearbetningen. Och jag har fortfarande i planer att hantera den imports@osm listan.
>Jag gjorde nyss en test "import" (Changeset: 69657316) av ett litet område >sydöst om Gistad i Linköpings kommun Vänligen notera det i tabellen här: [1] om det inte redan var gjort. > Att mappa detta område utan NMD datat som grund hade tagit avsevärt längre > tid. Bra att du drar någon nytta av datat! > Jag håller med om att resultatet inte på något sätt är perfekt Som jag skriver vidare i detta mejl, det är lite synd att vi inte har ett enigt sätt att mäta hur dåligt > Slutsatsen är väl att importera hela kommuner känns som ett för stort område Ja, det börjar se ut så. Jag har aldrig uteslutit att vi inte skulle bli tvungna att skära datat i ännu mindre bitar, av en anledning eller annan. Låt mig fundera över detta. Jag hoppas också att vi kan lista ut vilka områden inte behöver någon import alls innan vi fortsätter med mindre bitar. > Jag tittade lite snabbt i västra Härjedalen, men tyckte inte att det var > speciellt bra runt fjällen. Om du misstänker att importdatat för vissa kommuner har några brister som orsakades av felaktiga indata (t ex dålig upplösning, koordinater skiftade, taggar matchar inte verkligheten osv), ber jag dig och alla andra om att kommentera det i motsvarande raden i tabellen på wikisidan: [1]. Då ska det hjälpa till att se vilka områden mest sannolikt skulle gynnas av ett importförsök, och vilka ska vänta till bättre data/algoritmer eller inte ska importeras alls. Vi vet redan att några kommuner är såpass väl täckta av markanvändnings data så att de inte behöver en större import. Och jag trodde från början att data för vissa områden inte skulle stämma vekligheten. Så att vi vill hellre fokusera sig på de resterande områden. > Ja, terrängkartan som vektor er allerede CC0 fra LM og dermed helt åpent. Man > kan laste ned alt her (må bare registrere brukernavn): https://www.lantmateriet.se/sv/Kartor-och-geografisk-information/geodataprodukter/terrangkartan/ Tack för länken, ska kolla dit. >Min erfarenhet är att Terrängkartan stämmer dåligt med verkligheten. En del av >jordbruksmarken är i verkligheten skog numera. Kanske är den kartan för gammal redan? Oavsett det, man skulle kontrollera datat område för område, oavsett om det handlar om Terrängkartan eller NMD-importen. > Kanske är det bättre att kombinera data vid renderingen? Att ha en enskilt lager för t ex skog vore en bra kompromiss. Tyvärr,understöder OSM-projektet inte flera lager. I mitt fall använder jag oftast Garmin-vektorkartor som skapas från OSM-data. Där kan man ha två lager samtidigt, men då måste man väl flytta alla skogsytor som nu finns i OSM till ett enskilt lager? > men jag är lite orolig för att vi får en massa "brötig" komplicerad geometri > som ingen vågar ta i för att fixa (multipolygoner är ju alltid lite > avskräckande). Man kan inte undvika multipolygoner när man beskriver naturen, tyvärr. Och de kan bli långa och komplicerande, det motsvarar dess egenskaper i verkligheten. Du är väl inte förvånad att Mälaren beskrivs med en lång multipolygon, och det är knappast möjligt att förenkla den utan att tappa bort viktiga detaljer. Det är ett särskilt stort problem för de stora obebodda fjällområden men stora ytor skog/buskage som transformeras till enorma multipoygoner. > Nu har jag inte kollat upp 685231007 men, vad är problemet? Det är bara att > fixa. > Det är en åkeryta som överlappar en väg, vilket ser lite mysko ut. > Se t.ex. hur sträcka 685233899 *nästan* passar in i den omgivande polygonen. Jo, samma typ problem i både fallen. Förutom att det glider åkermark lite över/under en väg, finns det fula "trianglar" med två mycket långa sidor och en kort sida i närheten: http://paul7.net/i/2019.04.28/0004bcb8/spectacle.y10384.png Dessa artefakter vill jag gärna röja bort; se nedan om deras ursprung. > Jämför med alternativet att det inte finns någon skog alls. På den internationella importmejllistan dök upp en argument "bad data vs no data at all". Min inställning är att sån diskussion är värdelös ifall man inte kan mäta hur dålig eller hur bra någonting är. Visst är en "bra" sak bättre än en "dålig" sak. Men om man väljer mellan två "dåliga" saker (som förekommer i den verkliga världen) behöver man siffror. Till min överraskning när jag kikar på t.ex. Osmose-sidan som skulle visa alla eventuella problem som Vingåkers import skapade: http://osmose.openstreetmap.fr/en/byuser/Atakua_imports ser jag precis noll problem! Jag vill hellre se en tusen problem där än noll. Jag kan rätta till en tusen problem och förbättra mina verktyg/process för att undvika dem i framtiden, men hur kan jag rätta till noll problem? > Vi kanske har olika inställning till det hela. Jag tänker inte att efter > import så är allt klart och ska inte röras. Det vore bäst om vi kan minska krävande på uppföljningsarbete så mycket som möjligt. Det handlar alltid om signal/brus förhållande. Om jag kan låta bli ett fel kvar per 100 tusen nya objekt i importdata ska jag gärna göra det. Men vad om 2 fel? 3 fel? Man behöver alltid sätta gränsen, avsiktligt högre än noll. Men då behöver man kunde *mäta* felfrekvensen före och efter, och denna möjlighet har man inte för just den typ importen som Vingåkers kommun utsattes för. > Själv har jag spenderat massor med tid med att mappa in skog och åker i norra > och västra delarna av Linköping kommun. Samma sak för mig för Katrineholm, Gnesta, Norrtälje m fl samt områden i andra länder som jag är intresserad av. > Jag har inte räknat hur många timmar jag lagt på det men det är många och det > är ett projekt som pågått över flera års tid. Det tar helt enkelt för mycket > tid. Att få NMD datat som grund kommer spara så mycket tid. Att du, jag och andra behöver offra så mycket sin tid för att manuellt rita skog/åker beror inte minst på att OSM-projektet saknar bra verktyg för att bearbeta ytor. Jag vill återkomma till detta poäng senare. Jag tror fortfarande att NMD-datat är användbart för det ändamål vi vill ha det, men det är nu klart för mig att någon (kanske jag?) behöver skapa bättre insticksmodul för JOSM som t ex skulle underlätta bearbeta gränser mellan nya och gamla ytor, detektera mindre överlappningar mellan vägar och ytor osv. De är inte så stora algoritmiska utmaningar egentligen för att programmera dessa funktioner in i en mjukvarumodul. Och det skulle hjälpa enormt med de vanliga uppgifter man har när man ritar nya skogar eller importerar befintliga ytor som är bara "lite snedda". > Jag tror inte skriptarna kan göras så mycket bättre med tanke på hur låg > kvalitet det är på grundmaterialet (10x10 cm) och en kass? AI på det. Upplösningen är enligt dokumentationen 10×10 meter. Ärligt talat vill jag inte ha en bättre upplösning. Om det vore 1×1 meter blev alla datafiler 100 gånger större, då kunde man knappast bearbeta dem på en personlig dator. Resulterande vektors storlek skulle öka något proportionellt som inte vore bra heller. För en rak bilväg att ha bättre upplösning betyder att ta reda på vägens bättre start- och slutpunkter som två koordinater. För skogar lägger det bara mer data, mer detaljer som någon inte vill ha. Jag som brukar titta på skogskartan när jag står i skogen tycker att en upplösning (vare sig vektor eller raster) 100×100 meter är för låg, 1×1 meter är för fin, däremot brukar 10×10 meter vara nära gyllene medelvärdet. > Jag ogillar att det är skog med en massa vita hål i. Det bliver nog en > ful och kantig karta om detta importeras i större skala. Jag tror att det beror på två faktorer. 1. Borttagning av mindre polygoner för att minska datats storlek. 2. För aggressivt tillämpning av Douglas-Peucker utjämningen som jag använde efter Chaiken-filtret. Låt mig förklara var som hände med rasterdatat tlls det blivit till den karta du ser nu, och vad som kunde ha/ska göras bättre. Efter att man konverterat rastern till vektorn ser samtliga linjer ut som trappor med 90 graders vinklar. För att släta dem ut använder man Chaiken-filter. Filtret gör ett otroligt bra jobb förutom två negativa aspekter: 1. Lagrets storlek ökar (antalet noder ökar) 2. Vissa linjer som skulle vara raka (t ex skogs gräns nära en motorväg) förblir kantiga. Vinklarna är dock inte 90 grader utan ungefär 120 grader. Samtidigt förvandlas dock andra linjer till raka som de skulle. Det är ännu mer irriterande att dessa sågliknande linjer dyker upp vid de platser där man mest sannolikt ska se på kartan (nära vägar). Ingen skulle ju bry sig om en någon konstig kurva djupt i skogen. För att både förminska datats storlek och släta ut dessa såglinjer använder man Douglas-Peucker. Det gör sitt jobb också bra förutom att: 1. Det skapar hål mellan intilliggande ytor 2. Det tar ibland bort för flera noder. Mitt främsta villfarelse som jag uppfattar det nu var att förutsätta att samma filterparameter kan tillämpas till landets hela yta. Därför experimenterade jag med ett slumpvis utvalt kommuns lager, hittade "bästa" filterparameter och sedan lämpade dem till alla andra kommuner. Istället borde man hitta en bäst filterkombination på nytt för varsin kommun/område. Ibland vore det bättra att man inte använder Douglas-Peucker alls, och ibland att det endast tillämpas till större ytor. > Jag skulle hellre importera LMs vektorkartdata (om den nånsin släpps fri) som > ligger till grund för hitta.se Visst vore det att ha en datakälla i vektorformat så mycket bättre. Det skulle ha löst så mycket problem med rasterartefakter mot vilka jag kämpar nu. >Om så händer kan vi ju kanske massradera det här skräpet först. Jag vill vara en av de första som skulle göra det om vi får tillgång till bättre vektordata! På något sätt anser jag att NMD-datat ska ersätta nuvarande fläckar av CORINE2006 data som nu finns här och där. NMD-datat har bättre upplösning och är mer tidsenliga. Samtidigt plågas det av samma problem såsom conflation och (som vissa anser det) taggning. Trevlig fortsatt söndag! 1. https://wiki.openstreetmap.org/w/index.php?title=Import/Catalogue/NMD_2018_Import_Plan/Status_per_subarea >Воскресенье, 28 апреля 2019, 12:00 +03:00 от Karl-Johan Karlsson ><karl.johan.karls...@gmail.com>: > >Jag gjorde nyss en test "import" (Changeset: 69657316) av ett litet område >sydöst om Gistad i Linköpings kommun för att visa på hur användbart det data >som finns nu ändå är. För det första så vet jag inte om man i strikt mening >kan kalla det en import utan mer att jag har använt NMD datat som underlag >(tillsammans med Linköping Orthophoto) för manuell mapping. Att mappa detta >område utan NMD datat som grund hade tagit avsevärt längre tid. Jag håller med >om att resultatet inte på något sätt är perfekt, hade jag gjort det helt >manuellt så hade vissa delar blivit lite bättre mappade än de nu blev. >Slutsatsen är väl att importera hela kommuner känns som ett för stort område >med nuvarande kvalité på det ursprungliga NMD datat. > >MvH >Karl-Johan Karlsson > > >Den tors 25 apr. 2019 kl 16:11 skrev Grigory Rechistov via Talk-se < >talk-se@openstreetmap.org >: >>Hej alla, >>Hinner nu inte besvara alla riktigt fina anmärkningar/feedback som samlades i >>denna tråd, hoppas att göra det sent ikväll. >> >>Så här är nuvarande framsteg som jag känner det. >>1. Ett litet fiasko med Stockholms kommun >>2. Ett experiment med Vingåkers kommun som väckte en stor diskussion på >>imports@osm, >>jag hinner faktiskt inte läsa den igenom, vill hellre lösa befintliga problem >>med andra >>kommuners data så bra som möjligt. >>3. Flera mindre men viktiga förbättringar i skripten är redo, såsom >>borttagning av >>irriterande "trapporna" i sträckor som filtren inte kunde lösa, besparing >>av mindre polygoner under filtreringen om de är viktiga för topologi osv. >>4. Bättre förståelse på vad som behövs att förbättra i importdatat för att >>underlätta manuellt finkammande och lösa några klagomål. >>Nuförtiden känner jag till om två problem som väntar på lösningen innan man >>effektivt kan fortsätta utan att behöva göra alltför mycket handarbete över >>enstaka importdatalager. >> >>1. Rensning på självkorsande sträckor i datat. >>2. Se till att nya polygoner har gemensamma gränser med befintliga polygoner. >>Låt mig illustrera den första uppgiften med några siffror. Det förekommer >>självkorsningar och korsningar mellan t ex skogsområden. Hur många >>självkorsningar >>finns det i ett datalager beror bland annat på hur hårt filtreringen utförts >>och hur stort området är. >>Alla självkorsningar är oundvikliga artefakter och det går visst att fixa dem >>manuellt. Men det tar tid. >>Nuvarande felfrekvens är ungefär 0,0002 fel per objekt. För Vingåkers kommun >>som är lagom stor fanns det runt 100-150 varningar som jag manuellt löste >>före >>uppladdningen. För Bergs kommun som är cirka 10 gånger större finns det drygt >>1000 varningar och fel: >>https://atakua.org/p/nmd/intersections/0085-Bergs-konflikter.png >>Mitt syfte är att minska siffran till 0,00002 fel per objekt. >>Det skulle betyda att en att manuellt lösa alla kvarstående varningar på en >>lagom >>stor kommun skulle ta 10 minuter istället för en timme. För större kommuner >>skulle det förminska manuellt arbete från 10 timmar till en timme. >>Min iakttagelse är att de flesta självkorsningar består av en kort ögla: >>https://atakua.org/p/nmd/intersections/sj%c3%a4lvkorsande-str%c3%a4cka-1.png >>Det finns andra fall som är lite större men i princip är samma sak: >>https://atakua.org/p/nmd/intersections/sj%c3%a4lvkorsande-str%c3%a4cka-2.png >>Det finns dock svårare fall som jag inte ämnar lösa automatiskt, liksom en >>midja i mitten på en lång sträcka: >>https://atakua.org/p/nmd/intersections/sj%c3%a4lvkorsande-str%c3%a4cka-3.png >>Slutligen finns det fall som ser absolut hopplösa ut, men en människa kan >>lösa >>dem genom att helt enkelt ta bort allt krafs: >>https://atakua.org/p/nmd/intersections/sj%c3%a4lvkorsande-str%c3%a4cka-fucked-up.png >>Jag kom på en algorithm som kunde lösa "öglor" genom att lokalt skanna >>sträckor. >>Den skulle ta bort mindre irriterande självkorsningar som är de vanligaste, >>och >>dessutom ska den bli förhållandevis snabb. Nu behöver jag lite tid för att >>förverkliga den i mitt skript `nmd-gml-to-osm.py` som för övrigt >>redan filtrerar "trappor". >>Angående den andra uppgiften om gemensamma gränser, behövs det för att t ex >>ny skog inte hamnar delvis i befintliga sjöar. Det kan göras genom att knäppa >>noder till de noder som redan sitter på en intilliggande sträcka. Tyvärr har >>JOSM inte något bra verktyg för att göra det på ett smidigt sätt >>(Contour Merge passar inte i detta fall). Skog som har glidit in i vattnet >>rapporteras inte heller som en varning av JOSM, det ser fult ut och det >>irriterar mycket folk (inklusive mig själv). >>Det betyder att jag behöver förbättra `conflate.py` att knäppa noder till >>befintliga gränser. Det kommer säkert inte lösa alla tillfällen där problemet >>uppstår, men åtminstone blir dess antal mindre så att man kan rätta dem till. >> >> >> >>>Четверг, 25 апреля 2019, 13:05 +03:00 от Christian Asker < >>>christian.as...@gmail.com >: >>> >>>Min erfarenhet är att Terrängkartan stämmer dåligt med verkligheten. En del >>>av jordbruksmarken är i verkligheten skog numera. >>> >>>Dessutom är geometrierna i Terrängkartan anpassade för rendering och därmed >>>ligger objekt ganska fel ibland. >>>Vidare brukar skog och åkermark vara ganska stora multipolygoner som är >>>jobbiga att hantera. >>> >>>Mvh Christian >>> >>> >>> >>> >>> >>>NKA mapper < nkamap...@gmail.com > skrev: (25 april 2019 10:50:51 CEST) >>>>Ja, terrängkartan som vektor er allerede CC0 fra LM og dermed helt åpent. >>>>Man kan laste ned alt her (må bare registrere brukernavn): >>>>https://www.lantmateriet.se/sv/Kartor-och-geografisk-information/geodataprodukter/terrangkartan/ >>>> >>>>Filene er i shape-format som kan åpnes direkte i JOSM med OpenData plugin, >>>>og kommer inn som ferdige (multi)polygoner uten overlapp. Det ville være >>>>enkelt å konvertere automatisk til ferdig OSM-tagging. Dette er slik vi >>>>gjør import av markdata og vann i Norge. >>>> >>>>/NKA >>>>tor. 25. apr. 2019 kl. 10:59 skrev Ture Pålsson < t...@turepalsson.se >: >>>>>Egil skrev: >>>>> >>>>>> Jag skulle hellre importera LMs vektorkartdata (om den nånsin släpps >>>>>> fri) som ligger till grund för hitta.se - den verkar mycket bättre och >>>>>> snyggare. Om så händer kan vi ju kanske massradera det här skräpet >>>>>> först. >>>>> >>>>>Den *är* väl fri? Ska vara CC0 enligt websidan. Den var CC-nånting-annat >>>>>förr, men de ändrade det för ett tag sedan. >>>>> >>>>> >>>>>_______________________________________________ >>>>>Talk-se mailing list >>>>>Talk-se@openstreetmap.org >>>>>https://lists.openstreetmap.org/listinfo/talk-se >>> >>>-- >>>Skickat från min Android-enhet med K-9 Mail. Ursäkta min fåordighet. >>>_______________________________________________ >>>Talk-se mailing list >>>Talk-se@openstreetmap.org >>>https://lists.openstreetmap.org/listinfo/talk-se >> >> >>С наилучшими пожеланиями, >>Григорий Речистов. >>Med vänliga hälsningar, >>Grigory Rechistov >>With best regards, >>Grigory Rechistov >>_______________________________________________ >>Talk-se mailing list >>Talk-se@openstreetmap.org >>https://lists.openstreetmap.org/listinfo/talk-se С наилучшими пожеланиями, Григорий Речистов. Med vänliga hälsningar, Grigory Rechistov With best regards, Grigory Rechistov
_______________________________________________ Talk-se mailing list Talk-se@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-se