Bon dia, Com ja sabeu, estic treballant en la transició del sistema de "variants" que teníem fins ara en el diccionari monolingüe (i en alguns parells) al nou sistema de preferències. Actualment, queden molt poques entrades per convertir i ja hem pogut prescindir d'una de les dues compilacions per al valencià. Notareu que la compilació de l'apertium-cat és una mica més ràpida. Les darreres entrades que cal convertir tenen certes particularitats que vull compartir perquè doneu la vostra opinió i acordem un etiquetatge que ens agradi.
Fins ara, he classificat el lèxic que teníem com a "valencià" en diversos grups, en funció del fenomen concret. Per exemple, tenim casos com "meva/meua" o "nedar/nadar". Es pot triar una preferència que aplica el canvi desitjat a totes les paraules que comparteixen el grup. Tot això ho tenim en el monolingüe i es pot triar en qualsevol parell. El que queda ara són doblets català/valencià que gestionem de manera desigual, unes vegades en el monolingüe i altres en el bilingüe. Parlo de "dipòsit/depòsit" (monolingüe) i "rentar/llavar" (bilingüe), per exemple. Gestionar aquests doblets en el monolingüe té com a avantatges poder fer-los servir en qualsevol parell sense canvis i que l'entrada amb la preferència queda vinculada a l'entrada base (i és fàcil veure que les dues paraules tenen una relació). En contrapartida, no podem fer canvis complexos (flexió diferent, per exemple), que cal gestionar en els diccionaris bilingües dels parells. Per tant, tindríem: - Doblets en el diccionari monolingüe: canvis menors, ortogràfics ("dipòsit/depòsit"). - Doblets en el diccionari bilingüe: paraules diferents ("rentar/llavar"). Hi ha algun canvi menor gestionat actualment amb aquest sistema que es pot transferir al diccionari monolingüe. Dit tot això, ara que coneixeu tot el context, el detall que m'interessa comentar: en el cas dels doblets que tractem en el diccionari bilingüe, no hi ha cap indicació en el diccionari monolingüe que proporcioni informació sobre això. Només hi ha l'atribut "v", que indica la variant, però no quina és l'altra meitat del doblet. Tornem als exemples anteriors: Rentar: <e lm="rentar" v="cat"><i>rent</i><par n="abander/ar__vblex"/></e> Llavar: <e lm="llavar" v="val_gva val_uni"><i>llav</i><par n="abander/ar__vblex"/></e> Com que, amb el canvi a preferències, llevem l'atribut "v", queden dues entrades sense res que doni cap informació dialectal. Seria interessant poder indicar alguna mena de relació entre les dues entrades en el diccionari monolingüe, encara que estrictament no s'utilitzi ni en l'anàlisi ni en la generació. En altres paraules, una mena de "recordatori" per a qui estigui desenvolupant el diccionari bilingüe. He pensat recórrer a l'atribut "c" que tenim per a comentaris, com a mínim per a no perdre l'etiqueta de variant que teníem fins ara, i podríem indicar d'alguna manera un lema "base" compartit que vinculi les dues entrades i que permeti trobar fàcilment una des de l'altra. A tall d'exemple, una idea: Rentar: <e lm="rentar" c="v:cat rentar"> <i>rent</i><par n="abander/ar__vblex"/></e> Llavar: <e lm="llavar" c="v:val rentar"><i>llav</i><par n="abander/ar__vblex"/></e> Què en penseu? A reveure, *Marc Riera*
_______________________________________________ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala