2018-01-18 20:45 GMT+01:00 Lukáš Karas <[email protected]>:

> Overpass to bere s přesností na znak nebo na binární iterpretaci?
> Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou
> sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to
> chyba
> toho softwaru.
>

Ano, a zjevně je to přesně tak, viz seznam omezení na
https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters
(pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na
Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky
na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího
nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez
diakritiky).

V zásadě si Overpass asi představuje, že si to každý ošetří stylem

way["name"~"^V[ \u00A0]Tůních$"]

O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo
to nějak opravit/dodělat.

-- Petr Kadlec / Mormegil
_______________________________________________
Talk-cz mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-cz

Odpovedet emailem