El dia 5 d’abril de 2018 a les 10:38, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> El dia 5 d’abril de 2018 a les 9:26, Hèctor Alòs i Font <
> hectora...@gmail.com> ha escrit:
>
>> El dia 5 d’abril de 2018 a les 10:07, Jaume Ortolà i Font <
>> jaumeort...@gmail.com> ha escrit:
>>
>>>
>>> Per a acabar de completar el raonament, la regla seria exactament:
>>>
>>> Si darrere de preposició (o preposició + article) hi ha un verb conjugat
>>> (p1, p2, p3) que al mateix temps és una altra cosa que no és p1, p2, p3 (un
>>> nom, adjectiu, participi, infinitiu, etc.), llavors cal eliminar (REMOVE)
>>> el verb conjugat.
>>>
>>
>> He afegit aquesta regla, que el que fa és eliminar les formes personals
>> del verb rere una preposició:
>>
>> REMOVE:prep_VbN2 Verb + Pers IF (0 Verb + Pers) (-1C/* Prep);
>>
>>
>
> Això és. He fet el mateix per a l'altre cas (amb preposició i article), i
> he llevat les regles amb SELECT.
>
>
>>
>>> No veig clar l'ús del OR (encara que siga amb el "només a o només b").
>>> La lògica és de AND (una cosa *i *l'altra), i simplement té la funció
>>> de no deixar sense cap etiqueta una paraula, cosa que pot passar quan hi ha
>>> un error (prep + verb: "a cantaba").
>>>
>>
>> Jo tampoc sóc un expert en CG, però trobo que sovint calen les dues
>> coses: per una banda, cal que sigui AND (nom i verb), però per altra, si
>> fas un select, el problema és que has d'estar segur que sigui només una
>> cosa i l'altra. Altrament passa el que ha passat amb "Granada", que triant
>> entre nom comú i verb, s'ha esborrat l'opció de nom propi.
>>
>> Per això és sempre més segur fer REMOVE en comptes de SELECT: en el
>> context definit, saben que X no pot ser, però què és... no n'estem del tot
>> segurs.
>>
>
> Sí, jo ja pensava en el cas del REMOVE.  De totes maneres, veig que la
> precaució de veure si hi ha "una altra cosa" no cal perquè en CG no es
> deixa mai una paraula sense etiquetes, i per tant en el cas de "a cantaba"
> no s'aplicarà el REMOVE perquè "cantaba" només pot ser un verb conjugat.
>


Estava parlant en termes generals: els REMOVE són més segurs que els
SELECT. Això sí, deixen més ambigüitat. Tal com fem les coses, el CG és per
posar pedaços i la feina grossa de la desambiguació la segueix fent el tsx,
que és utilíssim, però també força limitat. Realment, no seria sobrer
invertir temps en desambiguar amb el Perceptró
<http://wiki.apertium.org/wiki/Perceptron_tagger>, com ha dit diverses
vegades en Marc. La meva opinió ha estat que per treure una versió nova de
cat-eng i cat-spa això no cal, però a mig termini trobo que val la pena. Jo
mateix encara no sé com funciona, però trobo que convé posar-m'hi algun
dia. El que passa és que amb el cat-fra, en què estic actualment, els
problemes més grossos son de falta de lèxic (i fraseologia!) i
transferència estructural.

Hèctor
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to