Hola Antoni,
Us ho comento doncs a la bit�cola del CVS del paquet koffice es comenta que s'afegeixen les entrades del oo i he pensat vejam si teniu cap treball al respecte i/o si es podrien sincronitzar aquests esfor�os.
Per a veure el llistat us enlla�o a l'arxiu de la nostra llista de correu, aix� aquest correu ser� un xic m�s petit:
B�, crec que hi ha dos conceptes diferents:
- Barbarismes, �s a dir, una forma estrangera normativament no acceptada (cumpleanys, tamany, etc). En catal�, tenim un munt per la proximitat de l'espanyol i del franc�s.
- Autocorecci�. Els sistemes d'autocorrecci� estan pensats per solventar errades principalment tipogr�fiques (qeu->que), malgrat alguna gent els fa servir per corregir errors sint�ctics i sem�ntics que s�n aquells que els correctors no gramaticals acostumen a simplement no detectar.
Algunes de les entrades que tu est�s introduint, com ara:
<item find="avans" replace="abans"/> <item find="corretgit" replace="corregit"/> <item find="comprobar" replace="comprovar"/>
S�n errades que un corrector ortogr�fic ja detecta, i que corregeix i es capa� de suggerir la forma correcta. Llavors, jo crec que introduir-les en un sistema d'autocorrecci� �s duplicar la feina i els recursos ling��stics (tenir la mateix informaci� a dos llocs).
Per altra banda, la detecci� i correcci� de barbarismes jo crec que correspon al corrector ortogr�fic i no pas a un sistema d'autocorrecci�. Per exemple, cap corrector pot suggerir "mida" com a forma correcta quan trobi "tamany" ja que morfol�gicament s�n totalment diferents, nom�s ho poden fer amb el suport de llistes de barbarismes, com ara mateix t� l'Abiword (que vaig fer jo mateix fa uns mesos).
Fa temps vaig preparar aquest fitxer que cont� aproximadament 4.000 barbarismes pel catal� amb la seva correcci�:
http://www.abisource.com/lxr/source/abispell/barbarisms/ca-ES-barbarism.xml
Potser et pot servir, a m�s el format XML �s semblant.
Jo crec que en un sistema d'autocorrecci� s'han d'incloure errades tipogr�fiques comuns, i si vols, algunes errades que els correctors no pugin detectar que siguin for�a comuns, per� intentaria no repertir el que el corrector ortogr�fic ja pot detectar.
Dit aix�, si est�s fent una llista d'aquest tipus tinc inter�s en donar-te un cop de m�. �s un tema que m'agrada for�a i tinc certa experi�ncia, per� penso que �s important establir uns criteris del que ha d'anar i no sigui simplement un sac on anem possant el que ens sembla, sin� que sigui tinguem uns criteris.
Per cert, widget �s giny. Ho trobar�s al Recull i malgrat no est� al CercaTerm el TERMCAT tamb� ho tradueix aix�.
Jordi, --
Jordi Mas i Hern�ndez - Abiword developer - http://www.abisource.com [EMAIL PROTECTED] - Softcatal� member - http://www.softcatala.org - Personal Homepage http://www.softcatala.org/~jmas
