Hola Antoni,


Us ho comento doncs a la bit�cola del CVS del paquet koffice es comenta que s'afegeixen les entrades del oo i he pensat vejam si teniu cap treball al respecte i/o si es podrien sincronitzar aquests esfor�os.

Per a veure el llistat us enlla�o a l'arxiu de la nostra llista de correu, aix� aquest correu ser� un xic m�s petit:

B�, crec que hi ha dos conceptes diferents:


- Barbarismes, �s a dir, una forma estrangera normativament no acceptada (cumpleanys, tamany, etc). En catal�, tenim un munt per la proximitat de l'espanyol i del franc�s.

- Autocorecci�. Els sistemes d'autocorrecci� estan pensats per solventar errades principalment tipogr�fiques (qeu->que), malgrat alguna gent els fa servir per corregir errors sint�ctics i sem�ntics que s�n aquells que els correctors no gramaticals acostumen a simplement no detectar.

Algunes de les entrades que tu est�s introduint, com ara:

<item find="avans" replace="abans"/>
<item find="corretgit" replace="corregit"/>
<item find="comprobar" replace="comprovar"/>

S�n errades que un corrector ortogr�fic ja detecta, i que corregeix i es capa� de suggerir la forma correcta. Llavors, jo crec que introduir-les en un sistema d'autocorrecci� �s duplicar la feina i els recursos ling��stics (tenir la mateix informaci� a dos llocs).

Per altra banda, la detecci� i correcci� de barbarismes jo crec que correspon al corrector ortogr�fic i no pas a un sistema d'autocorrecci�. Per exemple, cap corrector pot suggerir "mida" com a forma correcta quan trobi "tamany" ja que morfol�gicament s�n totalment diferents, nom�s ho poden fer amb el suport de llistes de barbarismes, com ara mateix t� l'Abiword (que vaig fer jo mateix fa uns mesos).

Fa temps vaig preparar aquest fitxer que cont� aproximadament 4.000 barbarismes pel catal� amb la seva correcci�:

http://www.abisource.com/lxr/source/abispell/barbarisms/ca-ES-barbarism.xml

Potser et pot servir, a m�s el format XML �s semblant.

Jo crec que en un sistema d'autocorrecci� s'han d'incloure errades tipogr�fiques comuns, i si vols, algunes errades que els correctors no pugin detectar que siguin for�a comuns, per� intentaria no repertir el que el corrector ortogr�fic ja pot detectar.

Dit aix�, si est�s fent una llista d'aquest tipus tinc inter�s en donar-te un cop de m�. �s un tema que m'agrada for�a i tinc certa experi�ncia, per� penso que �s important establir uns criteris del que ha d'anar i no sigui simplement un sac on anem possant el que ens sembla, sin� que sigui tinguem uns criteris.

Per cert, widget �s giny. Ho trobar�s al Recull i malgrat no est� al CercaTerm el TERMCAT tamb� ho tradueix aix�.

Jordi,
--

Jordi Mas i Hern�ndez   - Abiword developer - http://www.abisource.com
[EMAIL PROTECTED]     - Softcatal� member - http://www.softcatala.org
                        - Personal Homepage http://www.softcatala.org/~jmas







Respondre per correu electrònic a