Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.:

echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
"<g>"
"g" n f sg
"<mg>"
"mg" n m sp
"<kg>"
"kg" n m sp
"<mm>"
"mm" n m sp
"<cm>"
"cm" n acr m sp
"<m>"
"m" n f sg
"m" n acr m sp
"<km>"
"km" n acr m sp
"<l>"
"l" n m sp
"l" n f sg
"<dl>"
"dl" n m sp
"<ml>"
"ml" n m sp
"<s>"
"s" n f sg
"<.>"
"." sent

Cada vegada que es fa un traductor a o del català, cal anar esbrinant com
està codificada cada unitat de mesura. N'he creat les més habituals com a
n.acr.m.sp:
* n: perquè són noms i aquesta informació ajuda a la desambiguació
* acr: perquè són acrònims
* m: perquè les unitats que he posat són de gènere masculí (metres, grams,
litres i derivats)
* sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
Trobo que és millor incloure les dades morfològiques (part de l'oració,
gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
generació del gènere i nombre convenient (per tant és millot que "acr"
sense més).

No he esborrat res del que hi havia per no fer mal a ningú, però no seria
sobrer fer neteja alguna vegada.

Cordialment,
Hèctor
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to