O Martes 25 Novembro 2008 21:14, mvillarino escribiu:
> <Documento_TBX> = type, xml:lang, <Cabezallo>, <Corpo>
> <Corpo> = {<termEntry>}
> <termEntry> = id, [<descrip> | <descripGrp> | <admin> |
> <adminGrp> | <transacGrp> | <note> | <ref> | <xref>], {<langSet>}
> <langSet> = id, xml:lang, [<descrip> | <descripGrp> |
> <admin> | <adminGrp> |<transacGrp> | <note> | <ref> | <xref>], {<tig> |
> <ntig>}
> <ntig> = id, <termGrp>, [<descrip> |
> <descripGrp> | <admin> | <adminGrp> |<transacGrp> | <note> | <ref> | <xref>]
> <tig> = id, <term>, [<termNote>], [<admin> |
> <admingGrp> | <transacGrp> | <note> | <ref> | <xref>]
> <termGrp> = id, <term>, [<termNote> |
> <termNoteGrp>], [<termCompList>]
> <termNote> = id, xml:lang, type,
> target, datatype, "texto"
> <term> = id, "texto"
> [...]
> Como vai longo, sigo en mensaxe filla
>
Seguimos logo.
Cal sería entón a estrutura "chachi" para unha termEntry?
Na <termEntry>, os typos da <descrip> válidos son:
(para expresar propriedades e descricións de
conceitos)
audio
*definition
example
*explanation
figure
otherBinaryData
table
video
(para relacións entre conceitos)
todos os de 9.3.2 da especificación. Case
mellor deixalo estar.
(propriedades e descricións de termos)
reliabilityCode (ollo, ver a lista de
posibilidades na especificación:un número do 1 ao 10
(subconxuntos)
*subjectField
--con (*) sinalo os que considero debe(mos) empregar.
Para cada <langSet>, ou nalgún <langSet> das distintas <termEntry>, pode ser
interesante empregar un campo <admin>,
cos tipos:
applicationSubset (e.g. Kword ou kate)
projectSubset (e.g. KDE ou GNOME)
Agora habería que escoller se empregar, dentro da langSet:
a) <ntig><termGrp><term></term>/<termGrp></ntig>, como
no lokalize, ou
b) <tig><term></tig></term>
Penso que debería consultar con Shafforo a ver porque
escolleu a) para o lokalise.
En calquera caso, a pode incluirse unha <termNote> para o <term>, como no
exemplo do final, pode levar anexo cousas como (poden ser intersantes):
<admin> dos tipos: conceptOrigin, e as xa vistas
<descrip> " " : context, characteristic, explanation
<termNote> : etymology, grammaticalGender, grammaticalNumber,
partOfSpeech, termType (dunha listaxe de escollas),
As demais cousas, en ppio, seguramente non as precisemos para un dicionario
multilingüe básico.(1)
E con iso, axeitadamente metido nunha base de datos con opción a obtención dos
resultados mediante xml-rpc, e unha interface para engadir entradas (mesmo
através da CATT), estaría listo.
Se che parece ben, perguntolle iso a Shafforo.
(1) Si, por que limitalo ao par inglés-galego, cando pode ser: área do
coñecimento, definición, inglés, galego, catalán, portugués etc. ?
--
Best regards,
MV
<langSet xml:lang="en">
<ntig>
<termGrp>
<term>authentication</term>
<termNote type="partOfSpeech">noun</termNote>
</termGrp>
<descrip type="context">.</descrip>
</ntig>
</langSet>
<langSet xml:lang="ru">
<ntig>
<termGrp>
<term>подтверждение подлинности</term>
<termNote type="partOfSpeech">сущ.</termNote>
</termGrp>
</ntig>
</langSet>
</termEntry>