Unha petición e unha consulta

2012-12-05 Conversa Xusto Rodriguez Rio

Ola,

Aproveitando que tedes experiencia na publicación de glosarios
terminolóxicos en formato TBX, quería preguntarvos qué aplicación usades
para xerar os ficheiros .tbx e de que estrutura de datos partides.

Isto vén a conto de que nas vindeiras semanas imos editar uns Termos
básicos de arquitectura de computadores (676 conceptos) e queriamos
difundilo baixo licenza Creative Commons e en formatos .pdf e tbx.

Usando a aplicación mrc2tbx elaboramos unha primeira versión en formato
tbx-basic, e agradeceríavos que lle botarades un ollo a unha mostra do
ficheiro (engádoa a seguir) e me dixésedes se lle vedes algún erro
relevante.

Mil grazas

Xusto
SNL da USC

---Mostra do ficheiro tbx---

?xml version='1.0' encoding=UTF-8?
!DOCTYPE martif SYSTEM TBXBasiccoreStructV02.dtd
martif type=TBX-Basic-V1 xml:lang=gl
martifHeader
fileDesc
titleStmt
titletermbase from MRC file/title
/titleStmt
sourceDesc
pgenerated by mrc2tbx version 3.3/p
/sourceDesc
sourceDesc
pAntelo Suárez, E.; X. A. Rodríguez Río (2012) Termos esenciais de
arquitectura de computadores. Santiago de Compostela : Universidade/p
/sourceDesc
/fileDesc
encodingDesc
p type=DCSNameTBXBasicXCSV02.xcs/p
/encodingDesc
/martifHeader
text
body
termEntry id=C001
descripGrp
descrip type=subjectFieldSistemas de interconexión/descrip
/descripGrp
langSet xml:lang=gl
tig id=C001gl1
termacceso directo a memoria remota/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
termNote type=grammaticalGendermasculine/termNote
/tig
tig id=C001gl2
termRDMA/term
termNote type=termTypeabbreviation/termNote
termNote type=partOfSpeechother/termNote
termNote type=grammaticalGendermasculine/termNote
/tig
/langSet
langSet xml:lang=es
tig id=C001es1
termacceso directo a memoria remota/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C001es2
termRDMA/term
termNote type=termTypeabbreviation/termNote
termNote type=partOfSpeechother/termNote
/tig
/langSet
langSet xml:lang=en
tig id=C001en1
termRDMA/term
termNote type=termTypeabbreviation/termNote
termNote type=partOfSpeechother/termNote
/tig
tig id=C001en2
termremote direct memory access/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
/langSet
/termEntry
termEntry id=C002
descripGrp
descrip type=subjectFieldProcesador. Memoria caché/descrip
/descripGrp
langSet xml:lang=gl
tig id=C002gl1
termacceso non uniforme a memoria/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
termNote type=grammaticalGendermasculine/termNote
/tig
tig id=C002gl2
termarquitectura NUMA/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
termNote type=grammaticalGenderfeminine/termNote
/tig
/langSet
langSet xml:lang=es
tig id=C002es1
termacceso no uniforme a memoria/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C002es2
termarquitectura NUMA/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C002es3
termNUMA/term
termNote type=termTypeabbreviation/termNote
termNote type=partOfSpeechother/termNote
/tig
/langSet
langSet xml:lang=en
tig id=C002en1
termnon-uniform memory access/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C002en2
termnon-uniform memory architecture/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C002en3
termNUMA/term
termNote type=termTypeabbreviation/termNote
termNote type=partOfSpeechother/termNote
/tig
/langSet
/termEntry
termEntry id=C003
descripGrp
descrip type=subjectFieldProcesador. Memoria caché/descrip
/descripGrp
langSet xml:lang=gl
tig id=C003gl1
termacerto de escritura na memoria caché/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
termNote type=grammaticalGendermasculine/termNote
/tig
/langSet
langSet xml:lang=es
tig id=C003es1
termacierto de escritura en la caché/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
tig id=C003es2
termacierto de escritura en la memoria caché/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
/langSet
langSet xml:lang=en
tig id=C003en1
termwrite cache hit/term
termNote type=termTypefullForm/termNote
termNote type=partOfSpeechnoun/termNote
/tig
/langSet
/termEntry
[...]
/body
/text
/martif


___
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto


Re: Unha petición e unha consulta

2012-12-05 Conversa Leandro Regueiro
2012/12/5 Xusto Rodriguez Rio xusto.rodrig...@usc.es:

 Ola,

Ola Xusto.

 Aproveitando que tedes experiencia na publicación de glosarios
 terminolóxicos en formato TBX, quería preguntarvos qué aplicación usades
 para xerar os ficheiros .tbx e de que estrutura de datos partides.

Eu adoito empregar diversos métodos, pero moitas veces escribo scripts
en Python para conversións ad-hoc complicadas. Outras veces só teño
que converter un ficheiro XML e polo tanto realizo tres ou catro
substitucións co editor de texto Gedit porque me é moito máis sinxelo.

Ademais disto existe unha ferramenta chamada csv2tbx que forma parte
do Translate Toolkit e que permite converter ficheiros CSV a formato
TBX. Polo que me comentaron, nas últimas versións do Translate Toolkit
non funciona, aínda que non vexo ningún bug relacionado con isto en
http://bugs.locamotion.org/ nin teño confirmación de primeira man de
que realmente non funcione.

Outra alternativa é usar
http://www.qa-distiller.com/support/How_To_Use_QA_Distiller/How_to_check_for_terminology_mistakes/Create_a_dictionary.htm#Calc
para converter follas de cálculo desde OpenOffice (e creo que
LibreOffice tamén) a TBX. Este método probouno Antón Méixome (segundo
me consta) e funciona, aínda que polo visto é necesario realizar
algunhas modificacións posteriores a man no ficheiro xerado para que
funcione con ferramentas como Virtaal.

Para realizar comprobacións sobre ficheiros TBX e ver se realmente
cumpren a especificación pódese utilizar TBXChecker
http://sourceforge.net/projects/tbxutil/

E claro, tamén utilizo o Terminator, unha ferramenta web para a
xestión de terminoloxía que desenvolvín eu mesmo, e que xera ficheiros
TBX correctos baixo demanda. A ferramenta segue en desenvolvemento
activo e espero que nos vindeiros meses reciba diversas melloras,
aínda que agora xa é funcional. O código está dispoñible en
http://gitorious.org/terminator Ademais hai unha instancia en
funcionamento en http://terminator.trasno.net/

 Isto vén a conto de que nas vindeiras semanas imos editar uns Termos
 básicos de arquitectura de computadores (676 conceptos) e queriamos
 difundilo baixo licenza Creative Commons e en formatos .pdf e tbx.

Que licenza Creative Commons exactamente?

 Usando a aplicación mrc2tbx elaboramos unha primeira versión en formato
 tbx-basic, e agradeceríavos que lle botarades un ollo a unha mostra do
 ficheiro (engádoa a seguir) e me dixésedes se lle vedes algún erro
 relevante.

Descoñecía esa ferramenta. É a ferramenta da que falan en
http://www.ttt.org/tbx ou vén sendo outra?

Poño os comentarios que teño sobre a mostra do ficheiro ao final da mensaxe.

 Mil grazas

A ti.

 Xusto
 SNL da USC

 ---Mostra do ficheiro tbx---

 ?xml version='1.0' encoding=UTF-8?
 !DOCTYPE martif SYSTEM TBXBasiccoreStructV02.dtd
 martif type=TBX-Basic-V1 xml:lang=gl
 martifHeader
 fileDesc
 titleStmt
 titletermbase from MRC file/title
 /titleStmt
 sourceDesc
 pgenerated by mrc2tbx version 3.3/p
 /sourceDesc
 sourceDesc
 pAntelo Suárez, E.; X. A. Rodríguez Río (2012) Termos esenciais de
 arquitectura de computadores. Santiago de Compostela : Universidade/p
 /sourceDesc
 /fileDesc
 encodingDesc
 p type=DCSNameTBXBasicXCSV02.xcs/p
 /encodingDesc
 /martifHeader
 text
 body
 termEntry id=C001
 descripGrp
 descrip type=subjectFieldSistemas de interconexión/descrip
 /descripGrp
 langSet xml:lang=gl
 tig id=C001gl1
 termacceso directo a memoria remota/term
 termNote type=termTypefullForm/termNote
 termNote type=partOfSpeechnoun/termNote
 termNote type=grammaticalGendermasculine/termNote
 /tig
 tig id=C001gl2
 termRDMA/term
 termNote type=termTypeabbreviation/termNote
 termNote type=partOfSpeechother/termNote
 termNote type=grammaticalGendermasculine/termNote
 /tig
 /langSet
 langSet xml:lang=es
 tig id=C001es1
 termacceso directo a memoria remota/term
 termNote type=termTypefullForm/termNote
 termNote type=partOfSpeechnoun/termNote
 /tig
 tig id=C001es2
 termRDMA/term
 termNote type=termTypeabbreviation/termNote
 termNote type=partOfSpeechother/termNote
 /tig
 /langSet
 langSet xml:lang=en
 tig id=C001en1
 termRDMA/term
 termNote type=termTypeabbreviation/termNote
 termNote type=partOfSpeechother/termNote
 /tig
 tig id=C001en2
 termremote direct memory access/term
 termNote type=termTypefullForm/termNote
 termNote type=partOfSpeechnoun/termNote
 /tig
 /langSet
 /termEntry
 termEntry id=C002
 descripGrp
 descrip type=subjectFieldProcesador. Memoria caché/descrip
 /descripGrp
 langSet xml:lang=gl
 tig id=C002gl1
 termacceso non uniforme a memoria/term
 termNote type=termTypefullForm/termNote
 termNote type=partOfSpeechnoun/termNote
 termNote type=grammaticalGendermasculine/termNote
 /tig
 tig id=C002gl2
 termarquitectura NUMA/term
 termNote type=termTypefullForm/termNote
 termNote type=partOfSpeechnoun/termNote
 termNote type=grammaticalGenderfeminine/termNote
 /tig
 /langSet
 langSet xml:lang=es
 tig id=C002es1
 termacceso no uniforme a memoria/term