Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam "<g>" "g" n f sg "<mg>" "mg" n m sp "<kg>" "kg" n m sp "<mm>" "mm" n m sp "<cm>" "cm" n acr m sp "<m>" "m" n f sg "m" n acr m sp "<km>" "km" n acr m sp "<l>" "l" n m sp "l" n f sg "<dl>" "dl" n m sp "<ml>" "ml" n m sp "<s>" "s" n f sg "<.>" "." sent
Cada vegada que es fa un traductor a o del català, cal anar esbrinant com està codificada cada unitat de mesura. N'he creat les més habituals com a n.acr.m.sp: * n: perquè són noms i aquesta informació ajuda a la desambiguació * acr: perquè són acrònims * m: perquè les unitats que he posat són de gènere masculí (metres, grams, litres i derivats) * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. Trobo que és millor incloure les dades morfològiques (part de l'oració, gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la generació del gènere i nombre convenient (per tant és millot que "acr" sense més). No he esborrat res del que hi havia per no fer mal a ningú, però no seria sobrer fer neteja alguna vegada. Cordialment, Hèctor
_______________________________________________ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala