Kara Joop,

Tuesday, December 9, 2008, 1:39:43 PM, Joop/vi skribis:
JE> Pardonu mian antaŭan neklarecon. Mi skribis pro programado, kiu
JE> ja okazas en la programlingvo PHP. Ĝi havas unikodan subtenon, sed
JE> tiu de Java estas eble pli bona. Uzi jam programitajn normojn
JE> estas pli bone. Post kelkaj pasintaj afiŝoj mi pensis, kial ne
JE> rigardi kiel la tiulingva lokaĵaro (en Java) liveras la ordigon
JE> aŭtomate. Ĝis nun la diskuto estis parte, ĉu iu indekso en la
JE> belorusa aŭ alia lingvo estas propre programita bone. Al mi estas
JE> neklara, kiugrade la programado estas komplika.
PHP estas pli bone, cxar ni povas uzi gxin sur la servilo. Java ne.

Ni unue parolu nur pri la ordigo en la indeksoj.

Eble gravas klarigi, ke mi ne bezonas programon kio ordigas. Sed mi
bezonas funkcion (eble programo en PHP) kio kreas de la informoj
vorto (en utf8) kaj lingvo (lingvokodo) la rezultojn ordigo kaj
komenclitero. Tiel ke mi poste povas uzi la bitokan sercxo de MySQL
por la ordigo tiel:
select lingvo, vorto from indeks where lingvo = 'eo' and komenclitero = 'x' 
order by ordigo;

La x de komenclitero kutime estas la unua litero de ordigo.
Tiel mi povas krei alfabetan indekson per SQL:
select komenclitero from indeks where lingvo = 'eo' order by komenclitero group 
by komenclitero;

Kompreneble mi ankaux bezonas funkcion, kio kalkulas de komenclitero
la utf8 formon aux mi bezonas aldonan kolumno.

Tio funkcio devas esti stabila, do se oni aldonas vorton, oni nur
novkalkulas tion vorton kaj la ordigo restas korekta.

Tio funkcio ne estu multekosta (do estu rapida).

Kaj la rezulto ne bezonu tro da spaco. Eble la duoblo de la spaco de
la vorto. Pli bone la saman spacon.

La funkcio devas funkcii kun cxiujn lingvoj kaj cxiuj vortoj. Sed la
rezulto devas esti diversa en diversaj lingvoj (fakte devas esti
diversa).

Se vi povas programi tion en PHP, mi povas doni pli da informoj.

Eble antauxe kontrolu, cxu en PHP estas tiel facile kaj cxu vere
solvas la problemon.

Por mi la programado ne estis tiom granda problemo, sed la multaj
diversaj lingvoj kaj reguloj.

Pri sercxado mi sxatus cxesi, cxar antauxaj mesagxoj jam tro miksis
sercxi kaj ordigo.

Pri plurlingva indekso/ordigo ni ne devas diskuti, cxar ni ne havas
tion problemon. Ni ne havas plurlingvon indekson. Ecx la rezulto de
la sercxo estas grupita laux lingvoj.

Se vi kredas, ke en Java la fontokodo estas uzebla por aliaj lingvoj.
Tiam unue kontrolu, cxu gxi solvas la problemon. Ekzemple prenu la
indeksoj de cxiuj lingvoj de revo kaj reordigu.

JE> Estas klare, ke por unulingvaj indeksoj oni sekvu ties
JE> lingvonormon, kies varieco impresas min (ekz. vokalaj diakritoj
JE> ignorataj, konsonantaj diakritoj signifaj). Por tio mi proponas
JE> rigardi al jam implementita programkodo. En Java la fontkodo estas
JE> havebla, kaj ili estas probable pro la tabeleco sufiĉe uzebla por
JE> aliaj programlingvoj. (Ekde mallonge oni povas mem krei lokaĵaron, kiel 
mankantan EO.)

JE> Por serĉado probable meritas la sendiakrita versio, kiu en Java
JE> estas akireble per ties unikoda subteno, sen propra (t.e. difindona) 
programado.

JE> Por plurlingva indekso/ordigo mi proponis vicon de (bazlitero,
JE> (diakritoj)), (bazlitero, (diakritoj)), ...
JE> Do
JE> a() c() i() d() a()
JE> a() c(^) a
JE> a(") c

JE> Ĉio ĉi estas iom naiva, nur konsideru majusklojn/minusklojn (ß),
JE> literduojn (ae, oe), mismiksoj kun la cirila (a, c).


-- 
amike
 Wieland                            mailto:[EMAIL PROTECTED]


                
___________________________________________________________ 
Telefonate ohne weitere Kosten vom PC zum PC: http://messenger.yahoo.de

Rispondere a