Bon dia,

Com ja sabeu, estic treballant en la transició del sistema de "variants"
que teníem fins ara en el diccionari monolingüe (i en alguns parells) al
nou sistema de preferències. Actualment, queden molt poques entrades per
convertir i ja hem pogut prescindir d'una de les dues compilacions per al
valencià. Notareu que la compilació de l'apertium-cat és una mica més
ràpida. Les darreres entrades que cal convertir tenen certes
particularitats que vull compartir perquè doneu la vostra opinió i acordem
un etiquetatge que ens agradi.

Fins ara, he classificat el lèxic que teníem com a "valencià" en diversos
grups, en funció del fenomen concret. Per exemple, tenim casos com
"meva/meua" o "nedar/nadar". Es pot triar una preferència que aplica el
canvi desitjat a totes les paraules que comparteixen el grup. Tot això ho
tenim en el monolingüe i es pot triar en qualsevol parell.

El que queda ara són doblets català/valencià que gestionem de manera
desigual, unes vegades en el monolingüe i altres en el bilingüe. Parlo de
"dipòsit/depòsit" (monolingüe) i "rentar/llavar" (bilingüe), per exemple.
Gestionar aquests doblets en el monolingüe té com a avantatges poder
fer-los servir en qualsevol parell sense canvis i que l'entrada amb la
preferència queda vinculada a l'entrada base (i és fàcil veure que les dues
paraules tenen una relació). En contrapartida, no podem fer canvis
complexos (flexió diferent, per exemple), que cal gestionar en els
diccionaris bilingües dels parells. Per tant, tindríem:

- Doblets en el diccionari monolingüe: canvis menors, ortogràfics
("dipòsit/depòsit").
- Doblets en el diccionari bilingüe: paraules diferents ("rentar/llavar").
Hi ha algun canvi menor gestionat actualment amb aquest sistema que es pot
transferir al diccionari monolingüe.

Dit tot això, ara que coneixeu tot el context, el detall que m'interessa
comentar: en el cas dels doblets que tractem en el diccionari bilingüe, no
hi ha cap indicació en el diccionari monolingüe que proporcioni informació
sobre això. Només hi ha l'atribut "v", que indica la variant, però no quina
és l'altra meitat del doblet. Tornem als exemples anteriors:

Rentar: <e lm="rentar" v="cat"><i>rent</i><par n="abander/ar__vblex"/></e>
Llavar: <e lm="llavar" v="val_gva val_uni"><i>llav</i><par
n="abander/ar__vblex"/></e>

Com que, amb el canvi a preferències, llevem l'atribut "v", queden dues
entrades sense res que doni cap informació dialectal. Seria interessant
poder indicar alguna mena de relació entre les dues entrades en el
diccionari monolingüe, encara que estrictament no s'utilitzi ni en
l'anàlisi ni en la generació. En altres paraules, una mena de "recordatori"
per a qui estigui desenvolupant el diccionari bilingüe. He pensat recórrer
a l'atribut "c" que tenim per a comentaris, com a mínim per a no perdre
l'etiqueta de variant que teníem fins ara, i podríem indicar d'alguna
manera un lema "base" compartit que vinculi les dues entrades i que permeti
trobar fàcilment una des de l'altra. A tall d'exemple, una idea:

Rentar: <e lm="rentar" c="v:cat rentar">  <i>rent</i><par
n="abander/ar__vblex"/></e>
Llavar: <e lm="llavar" c="v:val rentar"><i>llav</i><par
n="abander/ar__vblex"/></e>

Què en penseu?

A reveure,

*Marc Riera*
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to