Perdoneu per tardar tant.

En resum: estic d'acord amb tots :)

Anem per passos:

Entrant en el cas espanyol-català, ¿suggereixes que valdria més eliminar
> les marques d'invariable <i>?


Només en els casos on hi ha discrepància. Per exemple, no veig cap problema
en tindre <i>Madrid<np><top></i>. Algú veu un problema amb això?


la millor solució sempre hauria de ser desdoblar l'entrada en qüestió en
> <l> i <r> i tractar la discrepància al diccionari bilingüe i no afegir
> variants en un dels diccionaris monolingües per acceptar el que hi ha a
> l'altre.


Concidisc amb això, tot i que a vegades, la millor solució no és la
"viable". Com a exemple, quan es va fer tota la feina amb els noms propis a
apertium-cat, la manera més "senzilla" de que quasi tot continuara fu
ncionant a l'apertium spa-cat era aprendre a generar més coses de les que
s'analitzaven a l'apertium-spa i a l'apertium-cat. Es tractava, llavors,
d'una solució temporal (tot i que "indefinida") que, idealment s'anirà
resolent, tractant les diferències (si n'hi ha!) al monolingüe.


> Quant a la feina, si és productiva, o no, la meva impressió que ho és i
> molt. Per si mateixos, és cert, no donen gaire informació però són
> essencials per al desambiguador. Quan hi ha paraules desconegudes, va
> completament perdut. En cas d'ambigüitat, la paraula que hi ha després o
> abans no sap si és un verb, una preposició, un nom o el qui sigui. Per això
> sóc partidari, i he anat afegint, milers d'antropònims. I molts més que en
> falten! El que és cert, és que n'hi ha prou de tractar-los a l'engròs: una
> llista de cognoms, no te la mires gaire. Te la mires pel damunt per veure
> que no hi hagi errors evidents i, si pots, en carregues mil de cop.
>
> Hi ha un cas, com a mínim, però, que és que sí que aporten informació
> rellevant. En el cas de la concordança en gènere entre subjecte i atribut.
> La qüestió és que, per exemple, en el parell català-francès tens vora 1/3
> dels adjectius que són mf en un costat i m o f en l'altre. Sense informació
> de gènere, qui l'encerta l'endevina amb el gènere que poses per solucionar
> un GD.
>
>
+1

A la llarga, resulta productiu, i amb un diccionari bilingüe "net", no
generaria problemes. El cas actualment amb spa-cat és que no està net del
tot, amb moltes entrades com a <np> al bidix que tenen informació diferent
als respectius monolingües.


-- 
< Xavi Ivars >
< http://xavi.ivars.me >
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to