Salut,

Am pus un aspell6-ro-02-latin10.tar.bz2 in pagina de
download.

Un email earlier (nu situ cum de nu a ajuns pe lista):

>>>>>

Scuze pentru mesajul precedent, am uitat ca nu imparte
automat paragrafele in linii, asadar au iesit liniile
alea kilometrice.

Am observat si eu ieri seara chestia cu "intr".
Face parte din ciclul unde dai si unde crapa. Sa
incerc sa explic.

Eu tin cuvintele in liste separate, pot fi vazute
si descarcate de la

http://rospell.svn.sourceforge.net/viewvc/rospell/

(este un web svn, pot fi accesate si direct prin svn).

Am acolo liste pe caprarii de substantive, verbe,
nume proprii, etc. Printre ele si doua liste de
cuvinte extrase din dexonline.ro, una din 2006 si
alta de anul trecut. Acum, prin cele doua liste
dexonline exista multe greseli de spelling, greseli
care vor deveni foarte vizibile in momentul in care
spellerul incearca sa sugereze cuvinte corecte. Deci,
spellerul gaseste un cuvant gresit, si iti sugereaza
ca inlocuitor unul si mai gresit!

Este problema pe care o avea dictionarul precedent.
Am rezolvat-o foarte simplu, eliminand cele doua
liste dexonline din dictionar. Acum casuta de
sugestii arata mult mai bine. Totodata, cuvintele
corecte din listele dexonline au disparut din
dictionar. Va mai dura ceva pana voi apuca sa trec
prin cele doua fisiere, si sa extrag cuvintele
corecte. Este vorba de cateva zeci de mii de cuvinte
in fiecare fisier.

Iar acum mizeria cu "intr". Cuvantul acesta figura
in mod gresit in una din listele dexonline. In
momentul in care a fost elimint, au iesit la lumina
alte probleme care erau acolo de la bun inceput
insa nimeni nu le-a vazut. Este vorba despre
caracterul linioara '-' care joaca un rol diferit
in limba engleza si in limba romana. Practic,
openoffice.org considera ca '-' delimiteaza doua
cuvinte diferite si-i va trimite spellerului separat
cuvintele din stanga si din dreapta linioarei. Nu-mi
dau seama cum il convingem pe openoffice.org ca
in cazul nostru '-' functioneaza ca o litera si
nu desparte doua cuvinte.

Avem suport in aspell pentru acest lucru iar aspell
functioneaza corect. Are un fisier separat unde-i
specifici ce litere pot face parte dintr-un cuvant.

Practic nu-mi dau seama cum rezolvam problema global,
apare peste tot, in openoffice, gnome, kde, probabil
gasim ceva similar si prin mozille. Ii contactam
si le umplem bugzilele de buguri? Chiar sunt curios,
ce sanse am avea sa ne bage in seama.

Alta solutie este sa o mascam. Deschid o noua lista
cu cuvinte in mod intentionat gresite pe care o pun
in dictionar. Va rezolva "intr-o" si o serie de alte
cuvinte uzuale - a mers in releasul precedent fara sa
ne dam seama. Practic, intr-o luna putem fi gata cu un
nou release. Probabil este vorba de cateva zeci de
cuvinte. Mai adaug si alte cuvinte uzuale care s-au
evaporat pe drum.

Deci, ce facem?

Daca dati de cuvinte care fie lipsesc, fie se afla in
dictionar si nu ar trebui sa fie acolo, le postati
aici pe lista. Niciun cuvant nu este prea neimportant
pentru a fi corectat. Multumiri lui Cristi pentru
lista de probleme semnalata in emailul precedent.


Alex:
> tu parcă ai spus de un ro.cwd, e un alt
> fișier decât ro.cwl ?

Am facut altfel de data asta. Cei de la aspell.net
distribuie un pachet numit aspell-lang pentru
impachetat dictionare. Practic ii dau o lista
de cuvinte necompresata si ii specific formatul, isi
creaza singur ce-i trebuie, inclusiv arhiva tar.bz2.

Cred ca word-list-compress il foloseau in aspell
0.50, acum s-au mutat pe alte bazaconii. Iti fac
urgent un dictionar aspell latin10 si il pun in
pagina de download.

Lucian
--
http://rospell.sourceforge.net


      
____________________________________________________________________________________
Be a better friend, newshound, and 
know-it-all with Yahoo! Mobile.  Try it now.  
http://mobile.yahoo.com/;_ylt=Ahu06i62sR8HDtDypao8Wcj9tAcJ 


---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Raspunde prin e-mail lui