Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte
După cum spuneam, lista de care dispun este mult mai mare, circa 500 de mii de cuvinte. Aceasta este de fapt problema mea - este prea mare....
Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de cuvinte imensa dar nici reguli foarte complicate pentru afixe.
Perfect de-acord. Dar... cum procedăm? Consideraţi viabilă următoarea soluţie: aplicarea regulilor actuale asupra formelor bază şi eliminarea din listă a formelor flexionare astfel obţinute? Dacă da, cum pot reproduce programatic comportamentul OpenOfffce la aplicarea regulilor? On 27/04/07, Nicu Buculei <[EMAIL PROTECTED]> wrote:
Ionut Paduraru wrote: > Dispun de o listă destul de completă de cuvinte din limba română (inclusiv Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte > forme flexionare). Cum pot ajunge de la această listă la un dicţionar > ortografic? Trebuie să elimin intrările care se pot determina pe baza > regulilor? Şi dacă da, cum obţin regulile? > Nu ştiu cum funcţionează corectorul ortografic, dar bănuiesc că o listă de > câteva sute de mii de cuvinte ar întreuna foarte mult viteza de procesare. > Mă poate ajuta cineva? Arunca o privire la http://ro.openoffice.org/langtools/ro_RO-pack.zip Dictionarul ortografic contine doua fisiere: - o lista de cuvinte, ro_RO.dic; - o lista de afixe, ro_RO.aff, continind reguli flexionare a cuvintelor din dictionar. De principiu dictionarul poate functiona si numai cu lista de cuvinte, fara nici o regla de afixe, numai ca ar fi nevoie de o lista foarte lunga de cuvinte, care sa contina toate variatiile (singular-plural, declinari, conjugari, articulari etc.) Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de cuvinte imensa dar nici reguli foarte complicate pentru afixe. -- nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com my OpenOffice.org pages: http://ooo.nicubunu.ro Open Clip Art Library: http://www.openclipart.org my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/ --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
