Dne 11.2.2014 01:06, Petr Vejsada napsal:
Ahoj,
také jsem pilný a zdá se, že nástroj na nahrávání adres z RUIAN je
hotov.
Funguje tak, že se vybere oblast, pustí se SQL skript a za pár
(desítek) minut
je připravený changeset pro JOSM. K tomu z toho vypadnou varovací
tabulky se
seznamem míst, kde si to neporadilo a chce to lidský průzkum. Počet vět
v
těchto tabulkách je nepřímo úměrný kvalitě dat v RUIAN v dané oblasti
;-)
Podle tabulek s problémy se pak dají patřičná místa pravit v JOSM před
uploadem.
Ty tabulky mají stejný formát jako to csv co jsi posílal?
Nebylo by lepší ty sporné body nějak označit? Třeba tagem fixme. Líp se
to
pak bude v JSOM hledat/opravovat.
Potřebuji se domluvit na podobě dat.
Tyto tagy se zpracovávají:
addr:city - obec
addr:conscriptionnumber - číslo popisné
addr:housenumber - složenina, jak je popsaná na Wiki, tedy
ev.<evidenční> či
<popisné>/<orientační> atd,
addr:provisionalnumber - evidenční číslo
addr:streetnumber - číslo orientační
addr:place - část obce
addr:street - ulice
addr:postcode - PSČ
source:addr=cuzk:ruian
ref:ruian=<rn_adresni_misto.kod>
Na ostatní tagy nesahám, tedy nesahám ani na is_in, source,
addr:country či
další addr: či ne-addr:. Nesahám ani na souřadnice.
Algoritmus je osmiprůchodový, z toho 6 průchodů je na vlastní přiřazení
a
zbylé 2 jsou na generování varovných tabulek.
Zdrojáky tajné nejsou, je to 100% plpgsql/postgis, nicméně netvořil
jsem to
pro uživatele, ale pro sebe a tak kód odráží moji místní situaci -
vyžaduje
schema RUIAN, OSM APIDB (nikoli samotné API, jen databázové schema) a
Mapnik
schema. Urcite by slo predelat pro snapshot schema, které má sympatický
HSTORE, ale v tuto chvíli to tak není hlavně proto, protože snapshot
schema
nemám.
Udělej tomu nějakou konfiguraci, případně by mohlo nastavit si nějaká ta
synonyma. Koukal jsem, že postgresql by to měl umět. Myslím, že třeba
pro studijní
by se to mohlo hodit.
Pracuje to se všemi typy entit - s body, cestami/polygony i relacemi.
Nalezne-
li entitu s adresou (což nalezne skoro vždy), upraví ji tak, že nahradí
výše
zmíněné tagy a ostatních si nevšímá. Nenalezne-li, vytvoří nový adresní
bod se
souřadnicemi z RUIAN, a to buď deiniční bod adresního místa, není-li,
pak
deiniční bod stavebního objektu, není-li tak st_centroid stavebního
objektu.
Není-li, tak nic; na parcelu už jsem nešel, mohlo by to být geometricky
dost
mimo.
Co se týká mazání, tak momentálně se nic nemaže. Pamatuji si, který den
to
zpracuje která data a může pak porovnávat s RUIAN a mazat by se mohlo
tehdy,
kdy se adresa smaže z RUIAN a zároveň bylo toto místo zpracováno.
Zásadní otázka č.1 - co s tagy addr:country a is_in? Možnosti jsou
ponechat,
mazat či nahrazovat. Jaký máte názor?
Určitě nechat, případně opravit, ať je to aktuální. Když to tam zůstane,
tak
se nic strašného nestane.
Zásadní otázka č.2 - zda do toho vůbec jít, tedy začít probírat celou
republiku a pokud ano, co je třeba předtím udělat? O pravidlech pro
importy
ponětí mám a tak zahajuji diskusi s místní komunitou ;-).
Nebylo by škoda teď skončit, když už jsi tomu věnoval tolik času a
energie?
V nejhorším bych mohl udělal nějaký plugin, který by to dokázal využít.
BTW: czechaddress plugin by asi chtěl taky opravit. Přidat možnost
doplnit
chybějící údaje z RUIAN (pokud jsou k dispozici).
BTW 2: na Slovenském mailing listu je teď taky zajímavá debata o
odresách:
https://groups.google.com/forum/#!topic/osm_sk/YJr78HvG2TA
Marián
Mojí motivací bylo a je hlavně to, že Nominatim ve stávajících datech
moc
hledat neumí, protože is_in ho vůbec nezajímá, takže hlavně přidat
addr:place,
sjednotit vše a snad tedy zlepšit.
--
Petr, p...@propsychology.cz
p<
_______________________________________________
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
_______________________________________________
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz