Dacă nu mai e cineva interesat de contribuţie, contactează-mă pe mine pe vreun mesager şi putem colabora la dicţionar.
google talk: alexxed, yahoo: alexandruszasz, msn: [EMAIL PROTECTED] În data de 27.04.2007, Ionut Paduraru <[EMAIL PROTECTED]> a scris:
>> Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte După cum spuneam, lista de care dispun este mult mai mare, circa 500 de mii de cuvinte. Aceasta este de fapt problema mea - este prea mare.... >> Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de >> cuvinte imensa dar nici reguli foarte complicate pentru afixe. Perfect de-acord. Dar... cum procedăm? Consideraţi viabilă următoarea soluţie: aplicarea regulilor actuale asupra formelor bază şi eliminarea din listă a formelor flexionare astfel obţinute? Dacă da, cum pot reproduce programatic comportamentul OpenOfffce la aplicarea regulilor? On 27/04/07, Nicu Buculei <[EMAIL PROTECTED]> wrote: > > Ionut Paduraru wrote: > > Dispun de o listă destul de completă de cuvinte din limba română > (inclusiv > > Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte > > > forme flexionare). Cum pot ajunge de la această listă la un dicţionar > > ortografic? Trebuie să elimin intrările care se pot determina pe baza > > regulilor? Şi dacă da, cum obţin regulile? > > Nu ştiu cum funcţionează corectorul ortografic, dar bănuiesc că o listă > de > > câteva sute de mii de cuvinte ar întreuna foarte mult viteza de > procesare. > > Mă poate ajuta cineva? > > Arunca o privire la http://ro.openoffice.org/langtools/ro_RO-pack.zip > Dictionarul ortografic contine doua fisiere: > - o lista de cuvinte, ro_RO.dic; > - o lista de afixe, ro_RO.aff, continind reguli flexionare a cuvintelor > din dictionar. > > De principiu dictionarul poate functiona si numai cu lista de cuvinte, > fara nici o regla de afixe, numai ca ar fi nevoie de o lista foarte > lunga de cuvinte, care sa contina toate variatiile (singular-plural, > declinari, conjugari, articulari etc.) > > Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de > cuvinte imensa dar nici reguli foarte complicate pentru afixe. > > -- > nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com > my OpenOffice.org pages: http://ooo.nicubunu.ro > Open Clip Art Library: http://www.openclipart.org > my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/ > > --------------------------------------------------------------------- > To unsubscribe, e-mail: [EMAIL PROTECTED] > For additional commands, e-mail: [EMAIL PROTECTED] > >
-- Alexandru Szasz
