Hej! För att få en fingervisning om kvaliteten på själva datamängden som helhet har jag gjort ett stickprov bestående av ett område där jag har god lokalkännedom, nämligen Norbergs kommun. Kommunen omfattar ungefär 0,1 % av Sveriges yta och 0,05 % av befolkningen. Kommunen är kanske inte helt representativ -- det finns inga fäbodvallar eller större fritidshusområden och inte särskilt mycket lantlig bebyggelse överhuvudtaget -- utanför centralorten är det ärligt talat mest skog. Dessutom var i stort sett alla byar och många mindre platser redan utsatta. Det är alltså ett ganska litet urval (osäkert resultat) med huvudsakligen place=isolated_dwelling (antagligen sämre data än place=hamlet) och få obebodda platser (vilket borde dra upp kvaliteten jämfört med rikssnittet).
Med Overpass Turbo [1] sökte jag efter alla place-noder i kommunen som redigerats de senaste fyra veckorna (för några dagar sedan, så det kanske borde vara fem veckor nu). Sedan jämförde jag med Topografiska och Ekonomiska kartan samt med Maxar Premium. Tyvärr är ju Ekonomiska kartan-TMS:en otillgänglig för tillfället så jag har sökt ut kartbladen från Lantmäteriet [2] vilket tar längre tid. I stort sett alla noderna sitter lite vid sidan av objektet de syftar på, vilket i många fall lätt hade kunnat justeras utifrån satellitbilder eller Topografiska kartan själv. Topografiska kartan har ju inte riktigt samma principer för nodplacering som OSM. Två platser har taggats som place=hamlet: Källtorp och Sågtorpet. De verkar vara okej enligt Topografiska och Ekonomiska (även om Sågtorpet historiskt har hört till Örbäck). En stor grupp är isolated_dwelling-noder som verkligen syftar på en isolerad bostad. Det är kanske något av en smaksak om man i stället ska sätta namnet på en farmyard- eller residential-polygon, vilket är vad jag oftast har gjort. Ibland finns en sådan (namnlös) polygon redan, ibland inte. Farmyard ska väl strikt taget bara användas för aktiva bondgårdar och taggas om till residential om jordbruket har lagts ner eller arrenderats ut -- jag har förmodligen brukat vara lite för generös med farmyard. (Fiskarstugan, Flöarna, Hagby, Lindvreten och Rökedalen där polygon finns, samt Fårbo, Källbo och Sjöänget där polygon ännu saknas). Två tveksamma fall, Ekorrbo och Gruvan, ser ut att ligga mitt ute i skogen på satellitbilder, men det är byggnader utsatta på Topografiska så det skulle kunna vara korrekt. Sen om nån faktiskt bor där är svårt att veta... Två isolated_dwelling-noder, Leonardsberg och Brogården, ligger inne i samlad bebyggelse och borde ersättas med place=farm eller name= på en residential= eller building=. I de här fallen gick det att avgöra med Ekonomiska kartan vilken tomt som avsågs, men jag vågar inte tro att det funkar i allmänhet. En isolated_dwelling-nod, Kapellbacken, verkar syfta på en samling av flera hus (som finns redan på Ekonomiska men utan namn). Jag kan inte helt avfärda möjligheten att det är ett av husen specifikt. Slutligen det största misstaget: Högfors bruk är taggad som place=farm. Bruket ägde visserligen jordbruksmark men i huvudsak är det en nedlagd och delvis bevarad industri. Bruksområdet utgör de centrala delarna av byn Högfors (sedan tidigare taggad som place=hamlet). Jag har inte hittat några namn som är uppenbart oanvända idag, men de flesta ensamgårdarna känner jag inte till bättre än som namn på en karta. Om vi antar att alla namnen används och att Ekorrbo och Gruvan kan räknas som isolated_dwelling snarare än locality är det alltså en träffsäkerhet på 12/16 = 75 %, och även de hyfsade 75 % är slarvigt gjorda. En överslagsräkning utifrån Andreas användaruppgifter (93 intensiva redigeringsdagar med cirka 1000 redigeringar per dagsverke) och en Overpass-sökning efter alla place-noder i Sverige som redigerats de senaste fem veckorna (som tuggade länge innan den kom fram till 117 172 noder) ger båda vid handen att ungefär 100 000 noder importerats, give or take. Norbergs kommun har alltså, jämfört med sin andel av ytan och befolkningen, en ovanligt liten del av importen, och man kan misstänka att "svåra fall" var överrepresenterade i de saknade namnen. På riksnivå skulle kanske 90 % i själva verket kunna vara någorlunda korrekta. Det innebär fortfarande att 10 000 mer eller mindre felaktiga noder tillförts på kort tid utan att någon vill ta ansvar för dem. Även om felprocenten är jämförbar eller något bättre än genomsnittliga nybörjare blir slutresultatet värre eftersom redigeringstakten är så hög. Jag är verkligen inte emot att använda Topografiska kartan som _en_ källa vid OSM-arbete, men att använda den som _ensam_ källa utan någon form av urval och ordentlig manuell kontroll blir inte bra. Jag förespråkar att dessa redigeringar återställs om inte importorganisatörerna erbjuder sig att städa väldigt snart. Vänliga hälsningar Essin [1] https://overpass-turbo.eu/s/U8q [2] https://historiskakartor.lantmateriet.se/arken/s/advancedsearch.html Den mån 18 maj 2020 kl 18:51 skrev Andreas Vilén <[email protected]>: > Det verkar ha varit totalt 14 konton som genomfört denna import. Jag har > tagit en närmare titt på alla dessa konton för de har många gemensamma > nämnare. > > master-shake > http://hdyc.neis-one.org/?master-shake > Skapades 19/1. Låg oanvänt till 13/4. Testedits 13-15/4 och sedan drygt > 1000 changesets om dagen varje dag till 26/4. Efter det inga edits. Har > deltagit i två changesetdiskussioner på engelska: > https://resultmaps.neis-one.org/osm-discussion-comments?uid=10675834 > > ap-s > http://hdyc.neis-one.org/?ap-s > Skapades 19/1. Låg oanvänt till 19/4. Testedits 19-29/4 och sedan drygt > 1000 changesets om dagen varje dag till 6/5. Efter det inga edits. > > zag_abss > http://hdyc.neis-one.org/?zag_abss > Skapades 19/1. Låg oanvänt till 19/4. Testedits 19-24/4 och sedan drygt > 1000 changesets om dagen varje dag till 1/5. Efter det inga edits. > > Stasik1 > http://hdyc.neis-one.org/?Stasik1 > Skapades 17/5-2016. Genomförde runt 11 changesets då, det första i > Ukraina. Låg sedan oanvänt fram till 15/2 då några testedits gjordes fram > till 17/2. Gissningsvis i Indonesien men jag hittar inte detaljer om vilka > changesets dessa var. Låg igen oanvänt till 24/4. Testedits 24-27/4 och > sedan drygt 1000 changesets om dagen till 1/5. 353 changesets 4/5 sedan > åter runt 1000 om dagen 7-9/5. Efter det inga edits. > > tomas471 > http://hdyc.neis-one.org/?tomas471 > Skapades 19/4-2017. Genomförde runt 11 changesets då, den första i ett > HOT-projekt hotosm-project-2782 i Mozambique. Låg sedan oanvänt fram till > 14/2 då några testedits gjordes fram till 17/2. Låg igen oanvänt till 23/4. > Från det datumet gjordes runt 1000 changesets om dagen fram till 30/4. > Efter det inga edits. > > rohweder > http://hdyc.neis-one.org/?rohweder > Skapades 10/10-2009. Genomförde något 20-tal edits i Tyskland runt > november 2010 och framåt. Låg sedan oanvänt till 15/2 då några testedits > gjordes fram till 17/2. Också dessa i Indonesien verkar det som. Låg igen > oanvänt till 24/4. Några testedits till 26/4 sedan runt 1000 changesets om > dagen varje dag 27/4-1/5. Åter en massiv mängd changesets 8-9/5. Efter det > inga edits. > > serge_dahlin > http://hdyc.neis-one.org/?serge%20dahlin > Skapades 19/1. Låg oanvänt till 19/4. Testedits 19-24/4 och sedan drygt > 1000 changesets om dagen varje dag till 30/4. Efter det inga edits. Har > deltagit i två changesetdiskussioner på svenska: > https://resultmaps.neis-one.org/osm-discussion-comments?uid=10675882 > > mustahir > http://hdyc.neis-one.org/?mustahir > Skapades 9/5-2018. Genomförde drygt 10 edits då som en del av HOT-projekt > hotosmid-project-111 i Indonesien. Låg sedan oanvänt till 15/2 då några > testedits gjordes fram till 17/2. Också dessa i Indonesien. Låg igen > oanvänt till 25/4. Testedits 25-30/4 sedan runt 1000 changesets om dagen > nästan varje dag 1/5-9/5. Efter det inga edits. > > arraggonn > http://hdyc.neis-one.org/?arraggonn > Skapades 23/2-2012. Genomförde runt 10 edits då i Ryssland. Låg sedan > oanvänt till 15/2 då några testedits gjordes fram till 17/2. Även dessa i > Indonesien vad det verkar. Låg igen oanvänt till 24/4. Testedits 24/4-29/4 > sedan runt 1000 changesets om dagen nästan varje dag 30/4-9/5. Efter det > inga edits. > > bob_curse_isaac > http://hdyc.neis-one.org/?bob_curse_isaac > Skapades 19/1. Låg oanvänt till 19/4. Testedits 19/4-1/5 och sedan drygt > 1000 changesets om dagen 4-8/5. Efter det inga edits. > > Sivia1811 > http://hdyc.neis-one.org/?Sivia1811 > Skapades 12/8-2018. Genomförde runt 10 edits i Uganda som en del av > HOT-projekt hotosm-project-4974. Låg sedan oanvänt till 15/2 då några > testedits gjordes fram till 17/2. Även dessa i Indonesien. Låg igen oanvänt > till 24/4. Testedits 24/4-5/8 sedan runt 1000 changesets om dagen 9-12/5. > Efter det inga edits. > > ivan_petrov_2013 > http://hdyc.neis-one.org/?ivan_petrov_2013 > Skapades 19/1. Låg oanvänt till 19/4. Testedits 19/4-1/5 och sedan drygt > 1000 changesets om dagen 4-9/5. Efter det inga edits. > > Följande två konton avviker något från mönstret: > > 30d4f4e1ccf24 > http://hdyc.neis-one.org/?30d4f4e1ccf24 > Skapades 8/12-2013 och har varit någorlunda aktivt med lite under 30 > mappardagar om året sedan dess. Verkar ha redigerat i princip enbart i > Ryssland innan det plötsliga intresset för platsnamn i Sverige uppstod. Som > övriga konton genomfördes testedits 16-18/2, nya testedits 13-14/4 plus > 23/4. Mängder med changesets sedan 30/4-4/5. Efter det inga edits. Har > deltagit i en changesetdiskussion här: > https://www.openstreetmap.org/changeset/81081573 > > operaman > http://hdyc.neis-one.org/?operaman > Skapades 12/1 och gjorde några edits då. Låg sedan oanvänt till 1/5 och > har gjort edits av den här typen sedan dess. Användaren har också deltagit > i arbetet med att lägga in vindskydd. Operamans changesets ser lite > annorlunda ut och verkar lägga in många platser per changeset. Har deltagit > i ett antal changesetdiskussioner om just vindskydd: > https://resultmaps.neis-one.org/osm-discussion-comments?uid=10646352 > Nämner i ett av dem att någon form av skript används. > > Totalt skapades 6 konton för detta ändamål samma datum 19/1-2020. De har > följt samma mönster med ett antal testedits i februari i Indonesien sedan > legat oanvända igen fram till slutet av april/början av maj. För någon > vecka sedan slutade alla konton redigera tvärt, med lite olika > start/slutdatum. De konton som redan fanns sedan tidigare har konsekvent > inte skrivit några changesetkommentarer och verkar ha varit baserade i > olika delar av världen. Med tanke på det konsekventa mönstret har jag > väldigt svårt att tänka mig att det handlar om olika människor som gjort > dessa edits från alla möjliga delar av världen (med möjligt undantag för > operaman). Jag ser det som mer sannolikt att dessa konton haft svaga > lösenord som lätt kunnat gissas. Jag vet inte om DWG kan göra det men det > hade varit bra om man kunnat kontrollera om de alla redigerat från samma > ip-nummer exempelvis. > > Jag har ännu inte fått svar från något av kontona jag skickade meddelande > till. Avvaktar någon vecka för att se om jag får några. > > MVH Andreas > > On Sat, May 16, 2020 at 12:40 PM Essin <[email protected]> wrote: > >> Hej! >> >> För några dagar sedan började jag lägga märke till redigeringar som bara >> bestod av place-noder [1]. Efter ett tag insåg jag att de är en del av >> importen som diskuterades här i vintras [2]. Utifrån redigeringarna verkar >> det som att de är gjorda utan större hänsyn till vad som redan finns och >> utan större kontroll av den valda place-taggens rimlighet >> (place=isolated_dwelling på bondgårdar som ligger inne i byar och därför >> borde ha place=farm eller namnet på en landuse=farmyard-yta, dubbletter med >> befintliga landuse=farmyard- eller landuse=residential-objekt, place=hamlet >> som borde vara place=neighbourhood mm). Jag har letat, men inte hittat >> något sätt att enkelt se vilka redigeringar som ingår i importen. Det finns >> ingen hashtag eller annan standardiserad formulering i >> redigeringskommentarerna, det står inget på deltagande användares >> användarsidor, redigeringarna görs inte från separata importkonton, det >> finns inga import=yes-taggar på importerade noder, och det finns ingen >> lista över deltagare på wikisidan [3]. Dessutom lägger många användare in >> endast en nod per ändringsuppsättning, vilket gör det ännu mer >> svåröverskådligt. Finns det någon fungerande plan för genomgång och >> städning i efterhand? Det som står på wikisidan om samordning på denna >> mejllista och kontroll av enskilda användares redigeringar med Osmose >> verkar inte ha följts. >> >> Hälsningar >> Essin >> >> [1] https://www.openstreetmap.org/user/zag_abss/history >> https://www.openstreetmap.org/user/tomas471/history >> https://www.openstreetmap.org/user/bob_curse_isaac/history >> https://www.openstreetmap.org/user/Sivia1811/history mfl >> [2] >> https://lists.openstreetmap.org/pipermail/talk-se/2020-January/003790.html >> ff >> [3] >> https://wiki.openstreetmap.org/wiki/Import/Catalogue/Lantm%C3%A4teriet_GSD-Terr%C3%A4ngkartans_ortnamnsimport >> _______________________________________________ >> Talk-se mailing list >> [email protected] >> https://lists.openstreetmap.org/listinfo/talk-se >> > _______________________________________________ > Talk-se mailing list > [email protected] > https://lists.openstreetmap.org/listinfo/talk-se >
_______________________________________________ Talk-se mailing list [email protected] https://lists.openstreetmap.org/listinfo/talk-se
