Provedl jsem par zmen v programu tile-processor, binarky [1] i
zdrojove kody [2] muzete stahovat z mych stranek.

Hlavni zmeny:
rychlost - OCR utitlita se ted spousti pouze jednou pro kazdou
dlazdici - prineslo to cca dvojnasobnou rychlost zpracovani
drobne zvyseni presnosti - presnejsi orez popisku a vynechani budov
blizko praveho okraje (tak jak navrhoval Petr Dlouhy)
pridano logovani cinnosti
osetreni chyb - program by se ted mel byt schopny zotavit z vetsiny
chyb, pouze zaloguje co se stalo a pokracuje v cinnosti

V binarkach jsou dve verze tile processoru - jedna pro LINUX s upravou
od Petra Dlouheho ([3], bod 2), druha bez ni. Nechal jsem dve verze,
protoze u me verze s upravou dava o neco horsi vysledky pri OCR (cca o
1 - 2% vice chyb)

Progam jsem zkousel na platforme Win/.NET a Win/MONO a funguji bez
problemu. Nekoho bych poprosil aby vyzkousel jestli neni nejaky
problem na Linuxu.


Distribuovane pocitani
Diky vsem, kteri se ozvali a nabidli se, ze pomuzou s vypoctem.

Rozdelil jsem CR na dlazdice 0.2 x 0.2 stupne, celkem je to 302
dlazdic. Hranice jsou definovany v CSV souboru [4], prilozena je i
prehledova mapka. Zpracovani jedne dlazdice by se melo vejit do 1
hodiny.

CSV soubor ma nasledujici format
ID,sever,vychod,jih,zapad

Pro koordinaci jsem na wiki zalozil stranku [5]. Pokud se rozhodnete
pomoct, zapiste na wiki, jake dlazdice zpracujete - at se neco
nepocita vicekrat. Dlazdice prosim vybirejte postupne, at v tom neni
zmatek.

Moje idea dalsiho postupu je takova, ze vysledky vypoctu (CSV a LOG
soubory) zpracuju, pripadne opravim data na mistech, kde se vyskytnul
nejaky error a vysledek umistim nekde na web k dalsimu vyuziti pro
import adres.

Postup
1) na wiki napsat dlazdice, ktere se chystam zpracovat
2) ze souboru [4] zjistit hranice dlazdic
3) stahnout data z WMS CUZK

tile-downloader.exe -north [sever] -west [zapad] -south [jih] -east
[vychos] -addressPoints -output [ID-Dlazdice]

4) zpracovat dlazdici

tile-processor.exe -tiles [ID-Dlazdice] - output [ID-Dlazdice].csv

5) zabalit vytvorene soubory (CSV a LOG) a vysledek nekam uplodovat
nebo zaslat na mail o...@kabrt.cz

[1] http://lkabrt.aspone.cz/osm/cuzk.zip
[2] http://lkabrt.aspone.cz/osm/cuzk-source.zip
[3] http://lists.openstreetmap.org/pipermail/talk-cz/2010-January/004312.html
[4] http://lkabrt.aspone.cz/osm/oblasti.zip
[5] http://wiki.openstreetmap.org/wiki/Import_Adres_ČR/Prubeh_Zpracovani
--
Lukas

_______________________________________________
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz

Odpovedet emailem