Esa era máis ou menos a conclusión á que eu chegara: partOfSpeech, si ou si. 


Xusto A. Rodríguez
SNL da USC

-----Mensaje original-----
De: mvillarino [mailto:mvillar...@kde-espana.es] 
Enviado el: luns, 10 de decembro de 2012 13:51
Para: proxecto@trasno.net
Asunto: Re: Unha petición e unha consulta

>> 4. "partOfSpeech" en abreviacións. Se non llas inclúo, o mrc2tbx dáme a
>> seguinte mensaxe de erro:
>> Term C001gl2 lacks a partOfSpeech row. This TBX file may not be machine
>> processed. See line 11.
>> Term C001gl2 is lacking an element necessary for TBX-Basic.
>>         To make it valid for human use only, add one of:
>>                 a definition (at the language level)
>>                 an example of use in context (at the term level).
>>         To make it valid for human or machine processing, add its part of
>> speech (at the term level).
>> See line 11.
>
> Curioso. Pode que sexa un bug no mrc2tbx. Habería que contactar co
> desenvolvedor e comentarllo, porque igual o fai así por algunha razón
> que descoñezo. Habería que probar ademais a ver se falla se lle pos
> definicións e lle quitas o partOfSpeech.

Nunha das ligazóns que dades pode descargarse un .zip que contén un
documento coa especificación do Tbx-basic en formato pdf.
Nese ficheiro dise literalmente
«
7. Compliance
A terminology resource (database, file, or repository) is compliant
with TBX-Basic if it meets all of the followingconditions:
[...]
[...]
[...]
[...]
●Each entry contains at least one language section (<langSet
xml:lang='xx-XX'>) and at least one Term(<term>)
●One of the following conditions has been met:
○If the resource is intended to be submitted to any form of machine
processing (see definition below), eachterm level (<tig>) has a Part
of speech explicitly indicated through a <termNotetype="partOfSpeech">
element.
○If the resource is only intended for human consultation, the Part of
speech may be omitted if either aDefinition or a Context is provided.
»

Logo se o ficheiro que queredes producir está destinado a uso por
humanos, e os termos non conteñen definicións, deben necesariamente
conter o campo "partOfSpeech". Se por contra o ficheiro está destinado
a ser usado programaticamente, debe necesariamente conter o
"partOfSpeech".

A consecuencia prática é que hai que meter un partOfSpeech por collós,
dado que see lle pós definicións e lle quitas o partOfSpeech,
legalmente calquera ferramenta de TAO pode non cargar o ficheiro
porque si.


_______________________________________________
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto

Responderlle a