În data de 15.04.2007, Oleg Burlaca <[EMAIL PROTECTED]> a scris:
Buna ziua,
ma numesc Oleg Burlaca, sunt din Republica Moldova.
In cautarea unui dictionar mai avansat ispell/aspell pentru limbra
romana, am dat de aceasta lista de discutie.
Initial aveam scopul de a gasi cel mai recent si bogat dictionar pentru
al incorpora in motoarele de cautare open source
pentru generarea inflexiunilor la momentul cautarii (fuzzy search).
Din cauza campaniei de legalizare a produselor software care a demarat
la noi in tara, am hotarit sa folosesc
doar produse opensource. WinXp -> Linux, MSOffice -> OpenOffice.
Al doilea scop este elaborarea corectorului ortografic al limbii romane
pentru OpenOffice.
OpenOffice foloseste hunspell care la rindul sau utilizeaza dictionarele
in format aspell/myspell.
Astfel, ambele scopuri pot fi atinse prin elaborarea dictionarelor myspell.
Se pare ca dictionarul elaborat de Adrian Stoica e cel mai cuprinzator,
atit din
punct de vedere al numarului de cuvinte in dictionarul de baza (ro.dic),
cit si in sensul numarului de inflexiuni generate ale unui cuvint.
(Apropo, site-ul www.cuvinte.ro nu este accesibil, dictinarul l-am
gasit in pachetul http://rospell.sourceforge.net/index.html)
Am conectat dictionarul la pachetul OpenOffice... sunt multe cuvinte
neacoperite de regulile de inflexiune din ro.aff:
dedicată, strategice, stimularea, relaţiile, scopurilor ... etc
Corectorul ortografic pentru MSOffice elaborat in cadrul Institutului de
Matematica si Informatica din Moldova
acopera mai mai multe forme flexionate.
Planificam sa folosesc rezultatele obtinute de grupul de procesare al
limbajului natural din Institutul de Matematica
pentru a crea ro.dic + ro.aff, dar odata ce am dat de dictionarul
elaborat de Adrian Stoica, as fi foarte curios sa
aflu care sunt procedeele de creare al acestui dictionar, mai concret:
cum a fost elaborat fisierul de afixe? ati apelat la ajutorul
lingvistilor? etc.
Presupun că nu, e ceea ce m-a blocat şi pe mine, pentru că am
realmente nevoie de un lingvist, cel puţin să confirme unele dubii,
altfel aş pierde şi mai mult timp să devin eu un mini lingvist.
Dicţionarul creat de Adrian Stoica e cel mai cuprinzător, dar e
departe de a acoperi cea mai mare parte a limbii române.
Dacă eşti interesat să lucrezi la el cum sunt şi eu de fapt, dar eu
mai mult pentru aspell, pentru că e folosit mult în Linux, putem să
colaborăm la asta.
google talk: alexxed, yahoo: alexandruszasz
Probabil că nu am găsi un lingvist dedicat, dar cu siguranţă ar fi
câţiva care ar vrea să ajute.
--
Alexandru Szasz