O Tuesday 12 de August de 2008, mvillarino escribiu:
> > Baahh, ilexíbel. Moito visio é o que hai :)
> 
> Mande??

Unha broma: digo que hai que ter moito vicio para dicir que perl é
ilexíbel :) pero aos que somos sureños e de mar de cando en vez
escápasenos un "visio". Sobra dicir cal é a miña linguaxe de cabeceira
;)

> Nin papas. Eu o único que ando a procurar é por un sistema que permita
> facer a comparación bi-direccional entre as expresións e palabras
> contidas en dous textos face a un ficheiro de "dicionario bilingüe", e
> que avise cando non haxa aparición de "tradución legal"  no texto
> termo para unha das palabras ou expresións que estexan no texto orixe
> e no dicionario.

Xa. Se por exemplo tes un dicionario bilingüe que diga

file    ficheiro

e os textos A e B:

Open file
----
Abrir arquivo

precisarías usar freeling sobre os textos galego e inglés para verificar
a equivalencia.

$ analyzer -f /usr/share/FreeLing/config/en.cfg
Open open NN
file file NN

$ analyzer -f /usr/share/FreeLing/config/gl.cfg
Abrir abrir VMN01S0
arquivo arquivo NCMS000

A primeira columna é a forma, a segunda o lema e a terceira a etiqueta
(NCMS é, por exemplo, substantivo común masculino singular). Obviamente,
ás veces freeling erra na asignación da etiqueta (por exemplo no caso de
"open").

file = ficheiro != arquivo, co que daría un aviso.

O problema vén cando non hai equivalencia palabra a palabra, senón que
hai diferentes estruturas implicadas:

subst + subst [en] = subst + prep + subst [gl]

Network Folders = Cartafoles de rede

Aquí terías que traballar con termos, por exemplo usando un extractor
como 

http://gramatica.usc.es/~gamallo/gale-extra/index2.0.htm

ou tratando de detectalos dende o propio programa en base aos contidos
do dicionario bilingüe.

Hai un tempo na Facultade de Filoloxía da USC propuxérase un proxecto de
investigación que viña a facer algo similar, extraendo termos e as súas
equivalencias e tratando de integrar este recurso nas ferramentas libres
de axuda á localización, pero non fora aprobado.

-- 
Susana Sotelo Docio                         http://gramatica.usc.es/~sdocio
Linux User #96506                                          gpg-id: 0E9BEDA4

"Only after the last tree has been cut, only after the last river has
been poisoned, only after the last fish has been fished, only then you will
discover that money can not be eaten." -- Evelyn Waugh

Responderlle a