Ionut Paduraru wrote:
Dispun de o listă destul de completă de cuvinte din limba română (inclusiv

Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte

forme flexionare). Cum pot ajunge de la această listă la un dicţionar
ortografic? Trebuie să elimin intrările care se pot determina pe baza
regulilor? Şi dacă da, cum obţin regulile?
Nu ştiu cum funcţionează corectorul ortografic, dar bănuiesc că o listă de
câteva sute de mii de cuvinte ar întreuna foarte mult viteza de procesare.
Mă poate ajuta cineva?

Arunca o privire la http://ro.openoffice.org/langtools/ro_RO-pack.zip
Dictionarul ortografic contine doua fisiere:
- o lista de cuvinte, ro_RO.dic;
- o lista de afixe, ro_RO.aff, continind reguli flexionare a cuvintelor din dictionar.

De principiu dictionarul poate functiona si numai cu lista de cuvinte, fara nici o regla de afixe, numai ca ar fi nevoie de o lista foarte lunga de cuvinte, care sa contina toate variatiile (singular-plural, declinari, conjugari, articulari etc.)

Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de cuvinte imensa dar nici reguli foarte complicate pentru afixe.

--
nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com
my OpenOffice.org pages: http://ooo.nicubunu.ro
Open Clip Art Library: http://www.openclipart.org
my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Raspunde prin e-mail lui