[Talk-cz] WeeklyOSM CZ 339

2017-01-20 Tema obsahu Tom Ka
Ahoj, je dostupné vydání 339 týdeníku WeeklyOSM:

http://www.weeklyosm.eu/cz/archives/8619

* Budovy s podloubím.
* OSM SK v rádiu.
* Termín pro jarní MP.
* Výroční zprávy za 2016.
* Statistiky OSM za 2016.
* Mapa pro Horní Lužici.
* LiDAR data v DE.
* OSM pro Telegram.

Pěkné počtení ...

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Marián Kyral
Dne 20.1.2017 v 12:06 Mikoláš Štrajt napsal(a):
> Tak vyzkoušeno v praxi:
>
> https://www.openstreetmap.org/changeset/45323834
>
> A skutečně se to na hlavní mapě projevilo, viz screenshot před úpravou:
>
> http://imgur.com/a/JhY8J 
>
> a po úpravě:
>
> http://imgur.com/a/gvOyL
>
> -- 
> Severák
>

No moc to nefunguje. Čekal bych, že se to zalomí před "u" :-D

Marián

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Marián Kyral
Dne 20.1.2017 v 21:17 Jan Martinec napsal(a):
> Jo pardon, je to novotvar vytvořený  Opráski Sčeskí Historje.
> Evidentně ho používám, aniž bych si to uvědomil.
> Zde starší (2012)
> varianta: http://historje.tumblr.com/post/36601048973/mitlologické-počátki
> 
>

Aha tak proto to neznám. Jejich prznění češtiny se mi nelíbí, takže je
ignoruji.
Konec zvídavého dotazu.

Marián

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Marián Kyral

-- Původní zpráva --
Od: Jan Martinec 
Komu: OpenStreetMap Czech Republic 
Datum: 20. 1. 2017 20:21:09
Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj 
"
...protože to první jsou čtyři znaky, a druhý je fskutčnosti znaků šest, 
totiž "B(kombinující háček)el(kombinující čárka)a", a obojí je rovnocenný 
způsob zápisu - ani jedno není workaround či  hack.
"
fskutčnosti  - to je nějaký novotvar? Poprvé jsem to bral jako překlep, ale 
podruhé už to nebude náhoda.


Marián

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Jan Martinec
(A když jsme u toho párování, porovnávání a podobných mňamek, __normalizace
velkých písmen už teď zdaleka nestačí__ - je třeba používat nástroje, který
má daný jazyk pro Unicode. Ne proto, že by to jinak nešlo, ale proto, že to
tuhle práci udělá samo, i pro případy, který by mě ani nenapadly. Což
znamená mj. to, že když ty stringy budeš porovnávat po bajtech, tak tě
kousne nejen whitespace, ale i případ, kdy "Bělá" je sice v Unicode rovno
"Bělá", ale převedený __na bajty__ bez normalizace do NFC nebo NFD to není
identický, protože to první jsou čtyři znaky, a druhý je fskutčnosti znaků
šest, totiž "B(kombinující háček)el(kombinující čárka)a", a obojí je
rovnocenný způsob zápisu - ani jedno není workaround či  hack.

Konec hlášení pro řetězcovou veřejnost ;))

Dne 20. 1. 2017 18:55 napsal uživatel "Lukáš Karas" :

> Ahoj,
>
> To jsme zase zpátky hledání problému pro řešení - pokud je ten datový
> zdroj s jakoukoli Unicode collation (mimo *_bin), tj. stávající stav, tak
> to bude hledat i porovnávat bez ohledu na diakritiku, velká a malá písmena,
> a dokonce i "exotické" whitespacy. (Exhibit A: Nominatim, zkuste si v něm
> trochu zavyhledávat)
>
> Já chápu, že po třiceti letech Kameníků a win1250 a kdoví čeho ještě máme
> všichni (já taky) neurózu z nabôdeníček, ale tady máme systém, který je
> (přinejmenším pro latinku) docela slušně promyšlený. Nevynalézejme hranatá
> kola.
>
> HPM
>
> Dne 20. 1. 2017 6:55 odp. napsal uživatel "Lukáš Karas" <
> lukas.ka...@centrum.cz>:
>
>> Tak tento problém musí všichni řešit už nyní.
>> A nemusíš ani chtít párovat OSM s jinými daty, ale třeba jen strojově
>> vytvořit
>> strom adres z OSM dat...
>>
>> Například máme název ulice "Pod Lipami" [1] ale adresní nody mají v
>> "addr:street" hodnotu "Pod lipami" [2].
>>
>> Takže musíš minimálně normalizovat velikost písmen, což je docela sranda
>> ale
>> dá se to pro latinku s přimhouřeným okem zvádnout, ale co dělat když máš
>> administrativní oblast "Bělá u Turnova" [3] ale tag "addr:place" je
>> nastaven
>> na "Bělá" [4] ?
>>
>> Je ale pravda že pokud program nenormalizuje bílé znaky tak jej pevná
>> mezera
>> rozbije, to je potřeba také zohlednit :-( OSM není bohužel (bohudík?)
>> relační
>> databáze, takže při práci s ní vždy bude docházet ke špatnému provázání
>> dat.
>>
>> Lukáš
>>
>>
>> 1) https://www.openstreetmap.org/way/28714626
>> 2) https://www.openstreetmap.org/node/296700722
>> 3) https://www.openstreetmap.org/relation/426770
>> 4) https://www.openstreetmap.org/node/198686670
>>
>>
>> Dne pátek 20. ledna 2017 16:45:07 CET jzvc napsal(a):
>> > Dne 19.1.2017 v 21:36 Jan Macura napsal(a):
>> > > //pardon, odeslal jsem mail předčasně
>> > >
>> > > 2017-01-19 9:01 GMT+01:00 Lukáš Karas > > >
>> > > >:
>> > > Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo
>> nechce
>> > > do osm
>> > > dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme
>> se
>> > > o pevných
>> > > mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě
>> být
>> > > součástí
>> > > všech strojově čitelných textů - tedy dle mě obsah.
>> > >
>> > > Chápu, ale pořád mi to nepřijde jako dostatečný argument. Je to jedno
>> > > bez druhého – informace o tom, kde nezalomit řádek může existovat jen
>> > > pro potřeby jeho zalomení a jsme zpátky u formátování dat (textu) pro
>> > > konkrétní potřeby.
>> > >
>> > > Ale ten hate Jana Martince mě trochu nalomil (sic!). Pokud neexistuje
>> > > žádný argument proti, kromě logického (to, co se tu snažím obhajovat),
>> > > nemá asi smysl tomu bránit. Navíc, když Ladislav Laska píše, že
>> některé
>> > > editory s tím umí pracovat, bral bych to v nejlepším duchu OSM (a
>> > > dobrovolnictví) jako možnost, ale určitě ne nutnost.
>> >
>> > Existuje minimalne jeden zasadni argument proti, u znacne casti prvku
>> > mapy je jejich nazev zaroven jejich identifikatorem (jednoduse proto, ze
>> > neni jiny). A sem opravdu zvedav, az bude nekdo porovnavat (pripadne na
>> > sebe navazovat) dve databaze, co rekne na to, ze mu to proti sobe nesedi
>> > jen proto, ze na jedny strane sou nejaky divny znaky, coz mu trvalo
>> > tyden zjistit.
>> >
>> > > 2017-01-19 9:11 GMT+01:00 Mikoláš Štrajt > > >
>> > > >:
>> > > Fun fact:
>> > >
>> > > RUIAN už skloňování názvů obcí ve své databázi má. V exportu je
>> to v
>> > > položce obi:MluvnickeCharakteristiky.
>> > >
>> > > A to je dobře. Plní tak pečlivě funkci registru územní identifikace.
>> > > Stejně tak bych čekal "mluvnické charakteristiky" třeba v GeoNames,
>> ale
>> > > ne v OSM ;-)
>> > >
>> > > 2017-01-19 10:35 GMT+01:00 Petr Kadlec > > >
>> > > >:
>> > > A ještě k
>> > >
>> > > >  je extrémně výhodné, aby velikost písmen byla přímo brána jako
>> > > >  součást obsahu>
>> > > To přece není „extrémně výhodné“ 

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Jan Martinec
Ahoj,

To jsme zase zpátky hledání problému pro řešení - pokud je ten datový zdroj
s jakoukoli Unicode collation (mimo *_bin), tj. stávající stav, tak to bude
hledat i porovnávat bez ohledu na diakritiku, velká a malá písmena, a
dokonce i "exotické" whitespacy. (Exhibit A: Nominatim, zkuste si v něm
trochu zavyhledávat)

Já chápu, že po třiceti letech Kameníků a win1250 a kdoví čeho ještě máme
všichni (já taky) neurózu z nabôdeníček, ale tady máme systém, který je
(přinejmenším pro latinku) docela slušně promyšlený. Nevynalézejme hranatá
kola.

HPM

Dne 20. 1. 2017 6:55 odp. napsal uživatel "Lukáš Karas" <
lukas.ka...@centrum.cz>:

> Tak tento problém musí všichni řešit už nyní.
> A nemusíš ani chtít párovat OSM s jinými daty, ale třeba jen strojově
> vytvořit
> strom adres z OSM dat...
>
> Například máme název ulice "Pod Lipami" [1] ale adresní nody mají v
> "addr:street" hodnotu "Pod lipami" [2].
>
> Takže musíš minimálně normalizovat velikost písmen, což je docela sranda
> ale
> dá se to pro latinku s přimhouřeným okem zvádnout, ale co dělat když máš
> administrativní oblast "Bělá u Turnova" [3] ale tag "addr:place" je
> nastaven
> na "Bělá" [4] ?
>
> Je ale pravda že pokud program nenormalizuje bílé znaky tak jej pevná
> mezera
> rozbije, to je potřeba také zohlednit :-( OSM není bohužel (bohudík?)
> relační
> databáze, takže při práci s ní vždy bude docházet ke špatnému provázání
> dat.
>
> Lukáš
>
>
> 1) https://www.openstreetmap.org/way/28714626
> 2) https://www.openstreetmap.org/node/296700722
> 3) https://www.openstreetmap.org/relation/426770
> 4) https://www.openstreetmap.org/node/198686670
>
>
> Dne pátek 20. ledna 2017 16:45:07 CET jzvc napsal(a):
> > Dne 19.1.2017 v 21:36 Jan Macura napsal(a):
> > > //pardon, odeslal jsem mail předčasně
> > >
> > > 2017-01-19 9:01 GMT+01:00 Lukáš Karas  > >
> > > >:
> > > Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo
> nechce
> > > do osm
> > > dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se
> > > o pevných
> > > mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě být
> > > součástí
> > > všech strojově čitelných textů - tedy dle mě obsah.
> > >
> > > Chápu, ale pořád mi to nepřijde jako dostatečný argument. Je to jedno
> > > bez druhého – informace o tom, kde nezalomit řádek může existovat jen
> > > pro potřeby jeho zalomení a jsme zpátky u formátování dat (textu) pro
> > > konkrétní potřeby.
> > >
> > > Ale ten hate Jana Martince mě trochu nalomil (sic!). Pokud neexistuje
> > > žádný argument proti, kromě logického (to, co se tu snažím obhajovat),
> > > nemá asi smysl tomu bránit. Navíc, když Ladislav Laska píše, že některé
> > > editory s tím umí pracovat, bral bych to v nejlepším duchu OSM (a
> > > dobrovolnictví) jako možnost, ale určitě ne nutnost.
> >
> > Existuje minimalne jeden zasadni argument proti, u znacne casti prvku
> > mapy je jejich nazev zaroven jejich identifikatorem (jednoduse proto, ze
> > neni jiny). A sem opravdu zvedav, az bude nekdo porovnavat (pripadne na
> > sebe navazovat) dve databaze, co rekne na to, ze mu to proti sobe nesedi
> > jen proto, ze na jedny strane sou nejaky divny znaky, coz mu trvalo
> > tyden zjistit.
> >
> > > 2017-01-19 9:11 GMT+01:00 Mikoláš Štrajt  > >
> > > >:
> > > Fun fact:
> > >
> > > RUIAN už skloňování názvů obcí ve své databázi má. V exportu je to
> v
> > > položce obi:MluvnickeCharakteristiky.
> > >
> > > A to je dobře. Plní tak pečlivě funkci registru územní identifikace.
> > > Stejně tak bych čekal "mluvnické charakteristiky" třeba v GeoNames, ale
> > > ne v OSM ;-)
> > >
> > > 2017-01-19 10:35 GMT+01:00 Petr Kadlec  > >
> > > >:
> > > A ještě k
> > >
> > > >  je extrémně výhodné, aby velikost písmen byla přímo brána jako
> > > >  součást obsahu>
> > > To přece není „extrémně výhodné“ [wut?], to je přece _pravda_. Ta
> > > obec se _nejmenuje_ „libčice nad vltavou“˝, ale „Libčice nad
> > > Vltavou“. _Proto_ to tam takhle máme. Ne proto, aby bylo jednodušší
> > > to hezky vykreslovat. Stejně tak máme mít třeba „PP Opatřilka//–
> > > Červený lom“, nikoli „PP Opatřilka - Červený lom“ (bez ohledu na
> to,
> > > jakým písmem to pak kdo vykresluje).
> > >
> > > Je to off-topic, ale snad bude strpen. Dokážu si představit takový
> > > datový model, kde jméno objektu nebude řetězec "Kostelec nad Černými
> > > lesy", ale objekt (v OSM tedy relace) se členy "kostelec", "černá",
> > > "les" a vyjádřením jejich vzájemných vztahů , které by velikost písmen
> > > implikovaly. Možné by to bylo, jen je to úplná blbost, takhle to
> > > modelovat (= tím myslím, že je to extrémně nevýhodné ;-) )
> > >
> > > H.
> > >
> > >
> > >
> > >
> > >
> > > ___
> > > Talk-cz mailing list
> > > 

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Lukáš Karas
Tak tento problém musí všichni řešit už nyní. 
A nemusíš ani chtít párovat OSM s jinými daty, ale třeba jen strojově vytvořit 
strom adres z OSM dat...

Například máme název ulice "Pod Lipami" [1] ale adresní nody mají v 
"addr:street" hodnotu "Pod lipami" [2].

Takže musíš minimálně normalizovat velikost písmen, což je docela sranda ale 
dá se to pro latinku s přimhouřeným okem zvádnout, ale co dělat když máš 
administrativní oblast "Bělá u Turnova" [3] ale tag "addr:place" je nastaven 
na "Bělá" [4] ?

Je ale pravda že pokud program nenormalizuje bílé znaky tak jej pevná mezera 
rozbije, to je potřeba také zohlednit :-( OSM není bohužel (bohudík?) relační 
databáze, takže při práci s ní vždy bude docházet ke špatnému provázání dat.

Lukáš


1) https://www.openstreetmap.org/way/28714626
2) https://www.openstreetmap.org/node/296700722
3) https://www.openstreetmap.org/relation/426770
4) https://www.openstreetmap.org/node/198686670


Dne pátek 20. ledna 2017 16:45:07 CET jzvc napsal(a):
> Dne 19.1.2017 v 21:36 Jan Macura napsal(a):
> > //pardon, odeslal jsem mail předčasně
> > 
> > 2017-01-19 9:01 GMT+01:00 Lukáš Karas  > 
> > >:
> > Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce
> > do osm
> > dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se
> > o pevných
> > mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě být
> > součástí
> > všech strojově čitelných textů - tedy dle mě obsah.
> > 
> > Chápu, ale pořád mi to nepřijde jako dostatečný argument. Je to jedno
> > bez druhého – informace o tom, kde nezalomit řádek může existovat jen
> > pro potřeby jeho zalomení a jsme zpátky u formátování dat (textu) pro
> > konkrétní potřeby.
> > 
> > Ale ten hate Jana Martince mě trochu nalomil (sic!). Pokud neexistuje
> > žádný argument proti, kromě logického (to, co se tu snažím obhajovat),
> > nemá asi smysl tomu bránit. Navíc, když Ladislav Laska píše, že některé
> > editory s tím umí pracovat, bral bych to v nejlepším duchu OSM (a
> > dobrovolnictví) jako možnost, ale určitě ne nutnost.
> 
> Existuje minimalne jeden zasadni argument proti, u znacne casti prvku
> mapy je jejich nazev zaroven jejich identifikatorem (jednoduse proto, ze
> neni jiny). A sem opravdu zvedav, az bude nekdo porovnavat (pripadne na
> sebe navazovat) dve databaze, co rekne na to, ze mu to proti sobe nesedi
> jen proto, ze na jedny strane sou nejaky divny znaky, coz mu trvalo
> tyden zjistit.
> 
> > 2017-01-19 9:11 GMT+01:00 Mikoláš Štrajt  > 
> > >:
> > Fun fact:
> > 
> > RUIAN už skloňování názvů obcí ve své databázi má. V exportu je to v
> > položce obi:MluvnickeCharakteristiky.
> > 
> > A to je dobře. Plní tak pečlivě funkci registru územní identifikace.
> > Stejně tak bych čekal "mluvnické charakteristiky" třeba v GeoNames, ale
> > ne v OSM ;-)
> > 
> > 2017-01-19 10:35 GMT+01:00 Petr Kadlec  > 
> > >:
> > A ještě k
> > 
> > >  je extrémně výhodné, aby velikost písmen byla přímo brána jako
> > >  součást obsahu> 
> > To přece není „extrémně výhodné“ [wut?], to je přece _pravda_. Ta
> > obec se _nejmenuje_ „libčice nad vltavou“˝, ale „Libčice nad
> > Vltavou“. _Proto_ to tam takhle máme. Ne proto, aby bylo jednodušší
> > to hezky vykreslovat. Stejně tak máme mít třeba „PP Opatřilka//–
> > Červený lom“, nikoli „PP Opatřilka - Červený lom“ (bez ohledu na to,
> > jakým písmem to pak kdo vykresluje).
> > 
> > Je to off-topic, ale snad bude strpen. Dokážu si představit takový
> > datový model, kde jméno objektu nebude řetězec "Kostelec nad Černými
> > lesy", ale objekt (v OSM tedy relace) se členy "kostelec", "černá",
> > "les" a vyjádřením jejich vzájemných vztahů , které by velikost písmen
> > implikovaly. Možné by to bylo, jen je to úplná blbost, takhle to
> > modelovat (= tím myslím, že je to extrémně nevýhodné ;-) )
> > 
> > H.
> > 
> > 
> > 
> > 
> > 
> > ___
> > Talk-cz mailing list
> > Talk-cz@openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
> 
> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz

signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu jzvc

Dne 19.1.2017 v 21:36 Jan Macura napsal(a):

//pardon, odeslal jsem mail předčasně

2017-01-19 9:01 GMT+01:00 Lukáš Karas >:

Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce
do osm
dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se
o pevných
mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě být
součástí
všech strojově čitelných textů - tedy dle mě obsah.


Chápu, ale pořád mi to nepřijde jako dostatečný argument. Je to jedno
bez druhého – informace o tom, kde nezalomit řádek může existovat jen
pro potřeby jeho zalomení a jsme zpátky u formátování dat (textu) pro
konkrétní potřeby.

Ale ten hate Jana Martince mě trochu nalomil (sic!). Pokud neexistuje
žádný argument proti, kromě logického (to, co se tu snažím obhajovat),
nemá asi smysl tomu bránit. Navíc, když Ladislav Laska píše, že některé
editory s tím umí pracovat, bral bych to v nejlepším duchu OSM (a
dobrovolnictví) jako možnost, ale určitě ne nutnost.



Existuje minimalne jeden zasadni argument proti, u znacne casti prvku 
mapy je jejich nazev zaroven jejich identifikatorem (jednoduse proto, ze 
neni jiny). A sem opravdu zvedav, az bude nekdo porovnavat (pripadne na 
sebe navazovat) dve databaze, co rekne na to, ze mu to proti sobe nesedi 
jen proto, ze na jedny strane sou nejaky divny znaky, coz mu trvalo 
tyden zjistit.






2017-01-19 9:11 GMT+01:00 Mikoláš Štrajt >:

Fun fact:

RUIAN už skloňování názvů obcí ve své databázi má. V exportu je to v
položce obi:MluvnickeCharakteristiky.

A to je dobře. Plní tak pečlivě funkci registru územní identifikace.
Stejně tak bych čekal "mluvnické charakteristiky" třeba v GeoNames, ale
ne v OSM ;-)

2017-01-19 10:35 GMT+01:00 Petr Kadlec >:

A ještě k

>  je extrémně výhodné, aby velikost písmen byla přímo brána jako součást 
obsahu


To přece není „extrémně výhodné“ [wut?], to je přece _pravda_. Ta
obec se _nejmenuje_ „libčice nad vltavou“˝, ale „Libčice nad
Vltavou“. _Proto_ to tam takhle máme. Ne proto, aby bylo jednodušší
to hezky vykreslovat. Stejně tak máme mít třeba „PP Opatřilka//–
Červený lom“, nikoli „PP Opatřilka - Červený lom“ (bez ohledu na to,
jakým písmem to pak kdo vykresluje).


Je to off-topic, ale snad bude strpen. Dokážu si představit takový
datový model, kde jméno objektu nebude řetězec "Kostelec nad Černými
lesy", ale objekt (v OSM tedy relace) se členy "kostelec", "černá",
"les" a vyjádřením jejich vzájemných vztahů , které by velikost písmen
implikovaly. Možné by to bylo, jen je to úplná blbost, takhle to
modelovat (= tím myslím, že je to extrémně nevýhodné ;-) )

H.





___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz




___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Karel Volný
On Thursday 19 January 2017 17:56:38 Matěj Cepl wrote:
> On 2017-01-19, 08:11 GMT, Mikoláš Štrajt wrote:
> > skutečně toto vše? - takže bychom vlastně neměli mít "Libčice
> > nad Vltavou" ale "Libčice nad Vltava"? :-)
> 
> Ale ta vesnice se tak nejmenuje!
> 
> Matěj

jistě, vesnice se tak nejmenuje poněvadž Libčice jsou město :-)

K.


signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Jan Martinec

On 01/20/17 13:18, Lukáš Karas wrote:

Ano, lidé na to budou zapmínat a dělat chyby. Stejně jako nyní se může stát že
někdo napíše název bez diakritiky.

Jak chceš indickému nebo čínskému vývojáři vysvětlit že by měl do svého
rendereru integrovat processor pro vkládání pevných mezer do českých názvů?
Jak chceš v rendereru detekovat že se jedná o češtinu?
Tak. Ano, můžeš teoreticky porovnávat name:* a name, a z toho hádat - 
ale vyčteš z toho jedině "toto je asi místní jazyk, tak na 80%" (pokud 
ti to nějaký tatar s Maps.me nepřepíše u Karlova mostu na name:cs=Károly 
Híd :D) - a zbylých dvacet procent bude chyba I.typu: "name=Москва, co 
je další v atributech? Aha, name:ab=Москва, takže máme jasno, použijme 
pravidla pro abcházštinu, další tagy už zkoumat netřeba."


Renderer by neměl být repozitář jazykových konvencí (a fakt pochybuju, 
že i Mapnik má nějakou takovou heuristiku), jen by měl respektovat 
hinty, kterými jsou právě ty konvence vyznačený - a jeden z těch hintů 
je "tady nelámat".


Jediné o co by renderer měl starat je respektovat unicode pravidla -
vykreslovat názvy správně v hebrejštině (psaná zprava) i v latince, či
kombinaci obého (i když jsem takové názvy v OSM ještě neviděl) zalamovat
dlouhé názvy jen tam kde je to možné...

A to je náhoda - v Missing Maps se zrovna mapuje
http://tasks.hotosm.org/project/2419 v Jižním Súdánu. Město se údajně, 
aspoň podle OSM name, jmenuje "Aweil أويل" (fskutčnosti name:en+ar)

http://www.openstreetmap.org/node/234617069#map=14/8.7555/27.3998
(Korejci to mají podobně, ale ti aspoň nemají RTL)

Neboli: NBSP zejména _centrální_ řešení. "Ať se stará renderer" znamená, 
že každý pisatel si bude smolit nějakou svoji interpolaci -

v horším případě se nebude obtěžovat vůbec, a zláme to hlava nehlava.

HPM

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Lukáš Karas
Ano, lidé na to budou zapmínat a dělat chyby. Stejně jako nyní se může stát že 
někdo napíše název bez diakritiky.

Jak chceš indickému nebo čínskému vývojáři vysvětlit že by měl do svého 
rendereru integrovat processor pro vkládání pevných mezer do českých názvů? 
Jak chceš v rendereru detekovat že se jedná o češtinu?

Jediné o co by renderer měl starat je respektovat unicode pravidla - 
vykreslovat názvy správně v hebrejštině (psaná zprava) i v latince, či 
kombinaci obého (i když jsem takové názvy v OSM ještě neviděl) zalamovat 
dlouhé názvy jen tam kde je to možné...

Lukáš

Dne pátek 20. ledna 2017 10:00:21 CET Marián Kyral napsal(a):
> -- Původní zpráva --
> Od: Pavel Machek 
> Komu: OpenStreetMap Czech Republic 
> Datum: 20. 1. 2017 9:33:43
> Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech
> 
> "On Thu 2017-01-19 17:57:44, Marián Kyral wrote:
> > Ahoj,
> > za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii
> > 
> > vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro
> > programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam
> > přijde taková nebo maková mezera, když obě od sebe nejdou normálně
> 
> rozeznat.
> 
> > A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam
> > 
> > budeme rádi, když ten název správně opíší a případně u kapitálek správně
> > tipnou, kam dát velká písmena. Sám s tím mám občas problém.
> > 
> > Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na
> > 
> > vstupu nebo renderery na výstupu.
> 
> Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro
> pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit
> "kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho
> ven?
> "
> 
> 
> Chtít "každý uživatel musí umět vložit nezalomitelnou mezeru na správné
> místo" a chtít "uživatel nikdy nezapomene vložit nezalomitelnou mezeru" asi
> taky nemůžem. V tomhle jsou ty programy spolehlivější. Je jich míň, líp se
> to hlídá a případně opravuje.
> 
> Marián
> =

signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Mikoláš Štrajt
Tak vyzkoušeno v praxi:



https://www.openstreetmap.org/changeset/45323834





A skutečně se to na hlavní mapě projevilo, viz screenshot před úpravou:




http://imgur.com/a/JhY8J 




a po úpravě:




http://imgur.com/a/gvOyL





-- 

Severák







-- Původní zpráva --
Od: Pavel Machek 
Komu: OpenStreetMap Czech Republic 
Datum: 20. 1. 2017 10:21:12
Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech

"Ahoj! 

> Od: Pavel Machek  
> Komu: OpenStreetMap Czech Republic  

> "On Thu 2017-01-19 17:57:44, Marián Kyral wrote: 
> > Ahoj, 
> > za sebe jako za uživatele k tomu můžu říct, že v běžném životě 
typografii 
> 
> > vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
> > programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 

> > přijde taková nebo maková mezera, když obě od sebe nejdou normálně 
> rozeznat. 
> > A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. 
Tam 
> 
> > budeme rádi, když ten název správně opíší a případně u kapitálek správně

> > tipnou, kam dát velká písmena. Sám s tím mám občas problém. 
> > 
> > Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory 
na 
> 
> > vstupu nebo renderery na výstupu. 
> 
> Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro 
> pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit 
> "kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho 
> ven? 
> " 
> 
> Ty pravidla kam vložit nezalomitelnou mezeru jsou poměrně jasně daná. 

Hmm. Hezky pokus. Ano, jsou nejake heuristiky. Ale poznat jestli 
pismenko "v" je predlozka nebo neco jineho, spolehlive nejde, stejne 
tak nejde spolehlive poznat jazyk. 

> Nevidím důvod, proč by to nemohly umět i renderery. Vykreslování Unicode 
> nápisů se všema exotickejma písmama je stejně taková bestialita, že se 
vždy 
> volá Pango nebo nějaká jiná knihovna na seskládání znaků.  

Nahore mas dva duvody. 

> "Automaticky pridani tvrdych mezer na uzemi CR by s rozumnou chybovosti 
> melo jit... Takze podle me je rozumny udelat to automaticky, a to 
> znamena debatu na imports@. Hadam ze pri ni se clovek taky dozvi 
> ze to je a ze to neni dobry napad :-). " 
> 
> To je IMHO moc práce s nepříliš velkým užitkem. Navíc hrozí, že něco 
> rozbijeme. 

Tak dle komentare nahore je to jednoduchy, tak jaky moc prace a jaky 
rozbijeme? imports@ se postara o review, o to se nebojim. 

> Nicméně navrhuju to na pár obcích vyzkoušet. Už o tom diskutujeme dost 
> dlouho. :-) 

Klidne... 
Pavel 
-- 
(english) http://www.livejournal.com/~pavelmachek 
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/
blog.html 
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Pavel Machek
Ahoj!

> Od: Pavel Machek 
> Komu: OpenStreetMap Czech Republic 

> "On Thu 2017-01-19 17:57:44, Marián Kyral wrote: 
> > Ahoj, 
> > za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii 
> 
> > vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
> > programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 
> > přijde taková nebo maková mezera, když obě od sebe nejdou normálně 
> rozeznat. 
> > A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam 
> 
> > budeme rádi, když ten název správně opíší a případně u kapitálek správně 
> > tipnou, kam dát velká písmena. Sám s tím mám občas problém. 
> > 
> > Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na
> 
> > vstupu nebo renderery na výstupu. 
> 
> Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro 
> pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit 
> "kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho 
> ven? 
> "
> 
> Ty pravidla kam vložit nezalomitelnou mezeru jsou poměrně jasně daná.

Hmm. Hezky pokus. Ano, jsou nejake heuristiky. Ale poznat jestli
pismenko "v" je predlozka nebo neco jineho, spolehlive nejde, stejne
tak nejde spolehlive poznat jazyk.

> Nevidím důvod, proč by to nemohly umět i renderery. Vykreslování Unicode 
> nápisů se všema exotickejma písmama je stejně taková bestialita, že se vždy 
> volá Pango nebo nějaká jiná knihovna na seskládání znaků. 

Nahore mas dva duvody.

> "Automaticky pridani tvrdych mezer na uzemi CR by s rozumnou chybovosti 
> melo jit... Takze podle me je rozumny udelat to automaticky, a to 
> znamena debatu na imports@. Hadam ze pri ni se clovek taky dozvi 
> ze to je a ze to neni dobry napad :-). "
> 
> To je IMHO moc práce s nepříliš velkým užitkem. Navíc hrozí, že něco 
> rozbijeme.

Tak dle komentare nahore je to jednoduchy, tak jaky moc prace a jaky
rozbijeme? imports@ se postara o review, o to se nebojim.

> Nicméně navrhuju to na pár obcích vyzkoušet. Už o tom diskutujeme dost 
> dlouho. :-)

Klidne...
Pavel
-- 
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) 
http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html


signature.asc
Description: Digital signature
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Marián Kyral

-- Původní zpráva --
Od: Pavel Machek 
Komu: OpenStreetMap Czech Republic 
Datum: 20. 1. 2017 9:33:43
Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech 
"On Thu 2017-01-19 17:57:44, Marián Kyral wrote: 
> Ahoj, 
> za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii 

> vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
> programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 
> přijde taková nebo maková mezera, když obě od sebe nejdou normálně 
rozeznat. 
> A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam 

> budeme rádi, když ten název správně opíší a případně u kapitálek správně 
> tipnou, kam dát velká písmena. Sám s tím mám občas problém. 
> 
> Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na

> vstupu nebo renderery na výstupu. 

Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro 
pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit 
"kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho 
ven? 
"


Chtít "každý uživatel musí umět vložit nezalomitelnou mezeru na správné 
místo" a chtít "uživatel nikdy nezapomene vložit nezalomitelnou mezeru" asi 
taky nemůžem. V tomhle jsou ty programy spolehlivější. Je jich míň, líp se 
to hlídá a případně opravuje.

Marián
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Mikoláš Štrajt




-- Původní zpráva --
Od: Pavel Machek 
Komu: OpenStreetMap Czech Republic 
Datum: 20. 1. 2017 9:33:42
Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech

"On Thu 2017-01-19 17:57:44, Marián Kyral wrote: 
> Ahoj, 
> za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii 

> vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
> programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 
> přijde taková nebo maková mezera, když obě od sebe nejdou normálně 
rozeznat. 
> A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam 

> budeme rádi, když ten název správně opíší a případně u kapitálek správně 
> tipnou, kam dát velká písmena. Sám s tím mám občas problém. 
> 
> Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na

> vstupu nebo renderery na výstupu. 

Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro 
pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit 
"kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho 
ven? 
"



Ty pravidla kam vložit nezalomitelnou mezeru jsou poměrně jasně daná.




TeX na to má program nazývaný vlna (http://www.fit.vutbr.cz/~martinek/latex/
czech.html#03), umí to i Word nebo OpenOffice.




Nevidím důvod, proč by to nemohly umět i renderery. Vykreslování Unicode 
nápisů se všema exotickejma písmama je stejně taková bestialita, že se vždy 
volá Pango nebo nějaká jiná knihovna na seskládání znaků. 




Renderer by prostě před renderThatText volal ehnaceTextTzpography, nebo tak 
něco. 

 
"Automaticky pridani tvrdych mezer na uzemi CR by s rozumnou chybovosti 
melo jit... Takze podle me je rozumny udelat to automaticky, a to 
znamena debatu na imports@. Hadam ze pri ni se clovek taky dozvi 
ze to je a ze to neni dobry napad :-). "



To je IMHO moc práce s nepříliš velkým užitkem. Navíc hrozí, že něco 
rozbijeme.




Nicméně navrhuju to na pár obcích vyzkoušet. Už o tom diskutujeme dost 
dlouho. :-)




-- Mikoláš Štrajt / Severák / http://severak.svita.cz/




___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Martin Ždila
Podľa mňa dávať do názvov tvrdé medzery zmysel má. Veď na tento účel
vlastne tú tvrdú medzeru vymysleli.

-- 
Ing. Martin Ždila 
OZ Freemap Slovakia
tel:+421-908-363-848
mailto:martin.zd...@freemap.sk
http://www.freemap.sk/
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Pavel Machek
On Thu 2017-01-19 17:57:44, Marián Kyral wrote:
> Ahoj,
> za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii 
> vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
> programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 
> přijde taková nebo maková mezera, když obě od sebe nejdou normálně rozeznat.
> A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam 
> budeme rádi, když ten název správně opíší a případně u kapitálek správně 
> tipnou, kam dát velká písmena. Sám s tím mám občas problém.
> 
> Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na 
> vstupu nebo renderery na výstupu.

Aby neco mohly resit programy, musi byt dana uloha srozumitelna pro
pocitac. Chtit "kazdy editor musi umet cesky" asi nemuzem. Chtit
"kazdy renderer musi umet cesky" asi taky neni dobry. Takze jak z toho
ven?

Automaticky pridani tvrdych mezer na uzemi CR by s rozumnou chybovosti
melo jit... Takze podle me je rozumny udelat to automaticky, a to
znamena debatu na imports@. Hadam ze pri ni se clovek taky dozvi
ze to je a ze to neni dobry napad :-).

Pavel
-- 
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) 
http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html


signature.asc
Description: Digital signature
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz