Re: [Talk-se] Problem med ortnamnsimporten

2020-05-24 tråd Essin
Hej!

För att få en fingervisning om kvaliteten på själva datamängden som helhet
har jag gjort ett stickprov bestående av ett område där jag har god
lokalkännedom, nämligen Norbergs kommun. Kommunen omfattar ungefär 0,1 % av
Sveriges yta och 0,05 % av befolkningen. Kommunen är kanske inte helt
representativ -- det finns inga fäbodvallar eller större fritidshusområden
och inte särskilt mycket lantlig bebyggelse överhuvudtaget -- utanför
centralorten är det ärligt talat mest skog. Dessutom var i stort sett alla
byar och många mindre platser redan utsatta. Det är alltså ett ganska litet
urval (osäkert resultat) med huvudsakligen place=isolated_dwelling
(antagligen sämre data än place=hamlet) och få obebodda platser (vilket
borde dra upp kvaliteten jämfört med rikssnittet).

Med Overpass Turbo [1] sökte jag efter alla place-noder i kommunen som
redigerats de senaste fyra veckorna (för några dagar sedan, så det kanske
borde vara fem veckor nu). Sedan jämförde jag med Topografiska och
Ekonomiska kartan samt med Maxar Premium. Tyvärr är ju Ekonomiska
kartan-TMS:en otillgänglig för tillfället så jag har sökt ut kartbladen
från Lantmäteriet [2] vilket tar längre tid.

I stort sett alla noderna sitter lite vid sidan av objektet de syftar på,
vilket i många fall lätt hade kunnat justeras utifrån satellitbilder eller
Topografiska kartan själv. Topografiska kartan har ju inte riktigt samma
principer för nodplacering som OSM.

Två platser har taggats som place=hamlet: Källtorp och Sågtorpet. De verkar
vara okej enligt Topografiska och Ekonomiska (även om Sågtorpet historiskt
har hört till Örbäck).

En stor grupp är isolated_dwelling-noder som verkligen syftar på en
isolerad bostad. Det är kanske något av en smaksak om man i stället ska
sätta namnet på en farmyard- eller residential-polygon, vilket är vad jag
oftast har gjort. Ibland finns en sådan (namnlös) polygon redan, ibland
inte. Farmyard ska väl strikt taget bara användas för aktiva bondgårdar och
taggas om till residential om jordbruket har lagts ner eller arrenderats ut
-- jag har förmodligen brukat vara lite för generös med farmyard.
(Fiskarstugan, Flöarna, Hagby, Lindvreten och Rökedalen där polygon finns,
samt Fårbo, Källbo och Sjöänget där polygon ännu saknas). Två tveksamma
fall, Ekorrbo och Gruvan, ser ut att ligga mitt ute i skogen på
satellitbilder, men det är byggnader utsatta på Topografiska så det skulle
kunna vara korrekt. Sen om nån faktiskt bor där är svårt att veta...

Två isolated_dwelling-noder, Leonardsberg och Brogården, ligger inne i
samlad bebyggelse och borde ersättas med place=farm eller name= på en
residential= eller building=. I de här fallen gick det att avgöra med
Ekonomiska kartan vilken tomt som avsågs, men jag vågar inte tro att det
funkar i allmänhet.

En isolated_dwelling-nod, Kapellbacken, verkar syfta på en samling av flera
hus (som finns redan på Ekonomiska men utan namn). Jag kan inte helt
avfärda möjligheten att det är ett av husen specifikt.

Slutligen det största misstaget: Högfors bruk är taggad som place=farm.
Bruket ägde visserligen jordbruksmark men i huvudsak är det en nedlagd och
delvis bevarad industri. Bruksområdet utgör de centrala delarna av byn
Högfors (sedan tidigare taggad som place=hamlet).

Jag har inte hittat några namn som är uppenbart oanvända idag, men de
flesta ensamgårdarna känner jag inte till bättre än som namn på en karta.
Om vi antar att alla namnen används och att Ekorrbo och Gruvan kan räknas
som isolated_dwelling snarare än locality är det alltså en träffsäkerhet på
12/16 = 75 %, och även de hyfsade 75 % är slarvigt gjorda. En
överslagsräkning utifrån Andreas användaruppgifter (93 intensiva
redigeringsdagar med cirka 1000 redigeringar per dagsverke) och en
Overpass-sökning efter alla place-noder i Sverige som redigerats de senaste
fem veckorna (som tuggade länge innan den kom fram till 117 172 noder) ger
båda vid handen att ungefär 100 000 noder importerats, give or take.
Norbergs kommun har alltså, jämfört med sin andel av ytan och befolkningen,
en ovanligt liten del av importen, och man kan misstänka att "svåra fall"
var överrepresenterade i de saknade namnen. På riksnivå skulle kanske 90 %
i själva verket kunna vara någorlunda korrekta. Det innebär fortfarande att
10 000 mer eller mindre felaktiga noder tillförts på kort tid utan att
någon vill ta ansvar för dem. Även om felprocenten är jämförbar eller något
bättre än genomsnittliga nybörjare blir slutresultatet värre eftersom
redigeringstakten är så hög. Jag är verkligen inte emot att använda
Topografiska kartan som _en_ källa vid OSM-arbete, men att använda den som
_ensam_ källa utan någon form av urval och ordentlig manuell kontroll blir
inte bra. Jag förespråkar att dessa redigeringar återställs om inte
importorganisatörerna erbjuder sig att städa väldigt snart.

Vänliga hälsningar
Essin

[1] https://overpass-turbo.eu/s/U8q
[2] https://historiskakartor.lantmateriet.se/arken/s/advancedsearch.html

Den mån 18 maj 2020 kl 18:51 skrev Andreas 

Re: [Talk-se] Samordning, dokumention & olika kommunikationskanaler

2020-05-24 tråd Andreas Vilén
När du föreslår ett nytt system för kommunikation, gör du bara att 
kommunikationen fragmenteras alltmer är jag rädd.

Lite som den här xkcd-klassikern: https://xkcd.com/927/

/Andreas

Skickat från min iPhone

> 24 maj 2020 kl. 21:05 skrev tomasy - :
> 
> 
> Som snabb kommunikationskanal föreslår jag Riot https://about.riot.im/ Det är 
> en opensource tjänst som inte sprider personlig data. Påminner om Slack. Man 
> kan föra diskussion i trådar. Det går att dela filer och bilder. Fler och 
> fler opensource-projekt använder Riot. Kan köras i browser men det finns även 
> appar för Android (Google och F-Droid), Appstore, Windows och Linux. Mozilla 
> har flyttat från IRC till Riot och efter 4 månader har de 4-10 * mer 
> medlemmar på sina grupper .  
> https://discourse.mozilla.org/t/updates-to-chat-mozilla-org-e2e-encryption-by-default-nicer-ui-email-notifications-and-sso-fixes/60425.
>  En del openstreetmap grupper finns redan där.
> 
> Nackdelen med Riot är att man inte har samma tydliga trådar som t.ex. forumet 
> eller maillinglistan.
> 
> Varför inte...
> Facebook. Alla vill inte vara med i Facebook pga. att de samlar personlig 
> data.
> IRC. Gammalt system som fler och fler går ifrån. Ingen historik.
> Mailinglista Bra att hitta trådarna efteråt men inte bra för snabb 
> kommunikation.
> /tomasy
> 
>> On 2020-05-16 11:22, Daniel Westergren wrote:
>> Tjenare,
>> 
>> En fråga som nog bättre lämpar sig att föra i den här mailinglistan än i 
>> Facebook-gruppen, då det inte är en enkel fråga utan kräver en djupare 
>> diskussion.
>> 
>> Frågeställningen rör vilka kanaler som är lämpligast för olika typer av 
>> diskussioner med det svenska OSM-communityt och hur vi samordnar vad som 
>> finns i wikin, där ju all viktig dokumentation bör samlas.
>> 
>> Befintliga kanaler
>> Enligt kommentarer i FB-gruppen är forumet egentligen bäst att använda för 
>> diskussioner, fast det används inte. Alltså är det inte bra. Likväl skrivs 
>> det frågor där, men de får sällan svar.
>> 
>> I andra hand mailinglistan, eftersom där sparas historiken garanterat (om än 
>> i en 90-talsinsinspirerad, antik lösning). Någon har även skrivit här i 
>> mailinglistan att de föredrar det, då de inte är med i FB-gruppen.
>> 
>> Men Facebook-gruppen är bra för snabbare diskussioner som inte är lika 
>> djupa, med enkla frågor och svar.
>> 
>> Dokumentationen ska sedan ske i wikin. Men det finns ingen som ansvarar för 
>> eller har en strategi för hur den ska underhållas och uppdateras för att 
>> faktiskt vara aktuell. Dessutom oklart vad vi behöver skriva på svenska och 
>> när det räcker med att hänvisa till det som finns på engelska.
>> 
>> Och så finns det kanske nån IRC-kanal om folk fortfarande använder sådant 
>> 2020?
>> 
>> En klassisk open source-röra med andra ord...
>> 
>> Vad kan vi göra?
>> Till att börja med, kan vi inte i alla de här kanalerna hänvisa till vilka 
>> kanaler som finns och vad de lämpligast används för?
>> I beskrivningen för FB-gruppen länkar vi till wikin och mailinglistan (och 
>> skriver att forumet inte bör användas).
>> I någon slags sidfot för den här mailinglistan länkar vi till wikin och 
>> FB-gruppen (och skriver att forumet inte bör användas).
>> I wikin beskriver vi hur dessa kanaler används och var vi föredrar att olika 
>> typer av kommunikation sker, beroende på vad det handlar om.
>> Var finns kanalerna dokumenterade?
>> Det finns i viss mån beskrivet på 
>> https://wiki.openstreetmap.org/wiki/Sv:Beginners%27_guide_1.6 (för den som 
>> råkar hitta den sidan...). 
>> 
>> Men där står hjälp-forumet överst (som bara är på engelska), sedan det 
>> egentliga forumet (där det svenska i praktiken inte används och därför ska 
>> vi inte locka nybörjare dit), sedan IRC (som vanliga människor inte har en 
>> aning om vad det är för något och används det fortfarande?), sedan 
>> mailinglistor (men inget specifikt om den svenska), sedan om användargrupper 
>> som länkar till en sida som inte finns och FB-gruppen nämns inte alls. Inte 
>> heller står det hur olika kanaler ska användas.
>> 
>> Rörig wiki
>> Jag tycker wikin är en sagolik röra och otroligt svår att navigera. Det 
>> blandas hej vilt med länkar till svenska och engelska sidor (utan att ange 
>> om länken går till en svensk eller engelsk sida) och ingen verkar ha koll på 
>> vilken information som fortfarande är aktuell och om länkar fortfarande 
>> fungerar. Hur ska vi kunna locka fler till OSM när det är så otroligt svårt 
>> att veta hur man ska hitta hjälp och var man hittar folk som kan svara på 
>> frågor och vägleda nya användare?
>> 
>> Samordning?
>> Finns det någon som helst samordning av OSM i Sverige? Skulle vi kunna söka 
>> medel via Wikimedia Sverige för att städa upp i den svenska OSM-wikin och 
>> förbättra den med aktuella resurser?
>> 
>> Ja, lite tillspetsat. Men ska vi få fler att använda och bidra till OSM så 
>> behövs samordning och uppstädning...  
>> 
>> 
>> Ser fram emot en kreativ diskussion om hur vi 

Re: [Talk-se] Samordning, dokumention & olika kommunikationskanaler

2020-05-24 tråd tomasy -
Som snabb kommunikationskanal föreslår jag *Riot* https://about.riot.im/
Det är en opensource tjänst som inte sprider personlig data. Påminner om
Slack. Man kan föra diskussion i trådar. Det går att dela filer och bilder.
Fler och fler opensource-projekt använder Riot. Kan köras i browser men det
finns även appar för Android (Google och F-Droid), Appstore, Windows och
Linux. Mozilla har flyttat från IRC till Riot och efter 4 månader har de
4-10 * mer medlemmar på sina grupper .
https://discourse.mozilla.org/t/updates-to-chat-mozilla-org-e2e-encryption-by-default-nicer-ui-email-notifications-and-sso-fixes/60425.
En del openstreetmap grupper finns redan där.

Nackdelen med Riot är att man inte har samma tydliga trådar som t.ex.
forumet eller maillinglistan.

Varför inte...
*Facebook*. Alla vill inte vara med i Facebook pga. att de samlar personlig
data.
*IRC*. Gammalt system som fler och fler går ifrån. Ingen historik.
*Mailinglista* Bra att hitta trådarna efteråt men inte bra för snabb
kommunikation.
/tomasy
On 2020-05-16 11:22, Daniel Westergren wrote:

Tjenare,

En fråga som nog bättre lämpar sig att föra i den här mailinglistan än i
Facebook-gruppen, då det inte är en enkel fråga utan kräver en
djupare diskussion.

Frågeställningen rör vilka kanaler som är lämpligast för olika typer av
diskussioner med det svenska OSM-communityt och hur vi samordnar vad som
finns i wikin, där ju all viktig dokumentation bör samlas.

*Befintliga kanaler*
Enligt kommentarer i FB-gruppen är forumet
 egentligen bäst att
använda för diskussioner, fast det används inte. Alltså är det inte bra.
Likväl skrivs det frågor där, men de får sällan svar.

I andra hand *mailinglistan*, eftersom där sparas historiken garanterat (om
än i en 90-talsinsinspirerad, antik lösning). Någon har även skrivit här i
mailinglistan att de föredrar det, då de inte är med i FB-gruppen.

Men *Facebook-gruppen* är bra för snabbare diskussioner som inte är lika
djupa, med enkla frågor och svar.

Dokumentationen ska sedan ske i *wikin*. Men det finns ingen som ansvarar
för eller har en strategi för hur den ska underhållas och uppdateras för
att faktiskt vara aktuell. Dessutom oklart vad vi behöver skriva på svenska
och när det räcker med att hänvisa till det som finns på engelska.

Och så finns det kanske nån *IRC-kanal* om folk fortfarande använder sådant
2020?

En klassisk open source-röra med andra ord...

*Vad kan vi göra?*
Till att börja med, *kan vi inte i alla de här kanalerna hänvisa till vilka
kanaler som finns och vad de lämpligast används för?*

   - I beskrivningen för FB-gruppen länkar vi till wikin och mailinglistan
   (och skriver att forumet inte bör användas).
   - I någon slags sidfot för den här mailinglistan länkar vi till wikin
   och FB-gruppen (och skriver att forumet inte bör användas).
   - I wikin beskriver vi hur dessa kanaler används och var vi föredrar att
   olika typer av kommunikation sker, beroende på vad det handlar om.

*Var finns kanalerna dokumenterade?*
Det finns i viss mån beskrivet på
https://wiki.openstreetmap.org/wiki/Sv:Beginners%27_guide_1.6 (för den som
råkar hitta den sidan...).

Men där står hjälp-forumet  överst (som
bara är på engelska), sedan det egentliga *forumet *(där det svenska i
praktiken inte används och därför ska vi inte locka nybörjare dit), sedan *IRC
*(som vanliga människor inte har en aning om vad det är för något och
används det fortfarande?), sedan *mailinglistor *(men inget specifikt om
den svenska), sedan om *användargrupper *som länkar till en sida som inte
finns och *FB-gruppen* nämns inte alls. Inte heller står det hur olika
kanaler ska användas.

*Rörig wiki*
Jag tycker wikin är en sagolik röra och otroligt svår att navigera. Det
blandas hej vilt med länkar till svenska och engelska sidor (utan att ange
om länken går till en svensk eller engelsk sida) och ingen verkar ha koll
på vilken information som fortfarande är aktuell och om länkar fortfarande
fungerar. Hur ska vi kunna locka fler till OSM när det är så otroligt svårt
att veta hur man ska hitta hjälp och var man hittar folk som kan svara på
frågor och vägleda nya användare?

*Samordning?*
Finns det någon som helst samordning av OSM i Sverige? Skulle vi kunna söka
medel via Wikimedia Sverige för att städa upp i den svenska OSM-wikin och
förbättra den med aktuella resurser?

Ja, lite tillspetsat. Men ska vi få fler att använda och bidra till OSM så
behövs samordning och uppstädning...


Ser fram emot en kreativ diskussion om hur vi kan förbättra detta utan att
det kräver alltför mycket ideella resurser (som sällan finns).

___
Talk-se mailing
listTalk-se@openstreetmap.orghttps://lists.openstreetmap.org/listinfo/talk-se
___
Talk-se mailing list
Talk-se@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-se