Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
O Xoves 27 Novembro 2008 18:51, Leandro Regueiro escribiu: > Recoñezo que me cazaches (iso se realmente non inventaches ti todo > iso, heino comprobar). Por outra parte supoño que non negarás que o > uso dunha "picklist" (algo que teremos que meter no glosario :)) é moi > aconsellable. Si, se es capaz de facer unha lista con todas as funcións gramaticais, casos etc que hai nos diferentes idiomas, e facer que o resultado sexa empregábel. > Um, pode ser. Pero tampouco ten sentido ter un langSet por cada termo > (tradución), xa que ademais de complicar todo bastante, fai que sexa > menos comprensible e que ocupe máis. Depende, se lle metes información , por ex. o proxecto do que ven (KDE, podes implementar o mesmo que fixemos con plugin, i.e. que cada un siga a facer o que mellor lle conveña, á vez que delimitar o campo. > >> Respondeu Sharostoff sobre por que escolleu ? > > > > Non, aínda non lle escrebín. > > Xa me tardas :) Feito, agora a agardar un par de semanas (non é broma) > > E xa postos, e non sería mellor colaborar con Nuno Veloso ? > > Eu xa estou a elo. De feito debe estar ata os collóns das > recomendacións (lease recriminacións) que lle levo facendo estes días. > Supoño que unha boa idea, se non te queres poñer a picarlle código, > seria probarlle o sistema de probas que ten, para darlle consellos. O > sitio de probas está en http://eremita.di.uminho.pt/terminologia/ Hei-no fazer, o de escrever código quase que cho deixo a ti, que és o que estuda cc. da computaçom (±). De qualquer jeito, se nom fôr pola grande quantidade de novas mensagens que ha para 4.2 (help, please) havía adicar-lhe tempo. E deixo o fio, que estamos na 10ª ou assi mensage em profundidade, e non tiramos nada produtivo. -- Best regards, MV
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
>>> (non copies o TBX dos rusos que está mal!): >>> En que? >> >> Para empezar en que traduciron o "noun" de partOfSpeech ó ruso. > > > > > Aínda que no TBX-Basic os valores si están restrinxidos a unha lista de > opcións dada, no XCS xeral que aparece na especificación non di nada diso, o > motivo: > «Data-categories that are not constrained to a picklist in the TBX default > «XCS can be constrained to a picklist in a user-group subset XCS (see 12.1 > «General information about TMLs). One obvious candidate for a user-group > «picklist is partOfSpeech, which for many languages can have standardized > «values.» Recoñezo que me cazaches (iso se realmente non inventaches ti todo iso, heino comprobar). Por outra parte supoño que non negarás que o uso dunha "picklist" (algo que teremos que meter no glosario :)) é moi aconsellable. >> Por outra banda temos o de poñer varios langSet do mesmo idioma dentro do >> mesmo termEntry (fixérono tanto co inglés coma co ruso), o que non >> estou seguro de que estea permitido... > > > > A non ser que me engane, ese (langSet)+ indica que un termEntry deve ter polo > menos un langSet. Non atopo onde diga que todas as langSet dun termEntry > deban ter diferentes xml:lang Um, pode ser. Pero tampouco ten sentido ter un langSet por cada termo (tradución), xa que ademais de complicar todo bastante, fai que sexa menos comprensible e que ocupe máis. >> >> Por outra banda vexo que todos parecen ter a teima de querer usar >> Pero esa información realmente non nos fai falta para nada. > Supoño que será por evitar problemas no futuro Vale. Pero se realmente facemos ben o traballo agora non haberia por que ter problemas en ningún futuro (agás un improbable futuro apocaliptico). >> Respondeu Sharostoff sobre por que escolleu ? > Non, aínda non lle escrebín. Xa me tardas :) >> Non, no open-tran só escolles un idioma xa que presupón que o idioma >> de orixe é o inglés. > Iso era antes (hai moito), agora podes escoller a lingua de orixe e de > partida. Simplesmente, por omisión está escollido o inglés como orixe. Creo que non me fixara. > E xa postos, e non sería mellor colaborar con Nuno Veloso ? Eu xa estou a elo. De feito debe estar ata os collóns das recomendacións (lease recriminacións) que lle levo facendo estes días. Supoño que unha boa idea, se non te queres poñer a picarlle código, seria probarlle o sistema de probas que ten, para darlle consellos. O sitio de probas está en http://eremita.di.uminho.pt/terminologia/ Ata logo, Leandro Regueiro
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
O Xoves 27 Novembro 2008 13:37, Leandro Regueiro escribiu: > >> (non copies o TBX dos rusos que está mal!): > > > > En que? > > Para empezar en que traduciron o "noun" de partOfSpeech ó ruso. Aínda que no TBX-Basic os valores si están restrinxidos a unha lista de opcións dada, no XCS xeral que aparece na especificación non di nada diso, o motivo: «Data-categories that are not constrained to a picklist in the TBX default «XCS can be constrained to a picklist in a user-group subset XCS (see 12.1 «General information about TMLs). One obvious candidate for a user-group «picklist is partOfSpeech, which for many languages can have standardized «values.» > Por outra banda temos o de poñer varios langSet do mesmo idioma dentro do > mesmo termEntry (fixérono tanto co inglés coma co ruso), o que non > estou seguro de que estea permitido... A non ser que me engane, ese (langSet)+ indica que un termEntry deve ter polo menos un langSet. Non atopo onde diga que todas as langSet dun termEntry deban ter diferentes xml:lang > >> Por outra banda vexo que todos parecen ter a teima de querer usar > Pero esa información realmente non nos fai falta para nada. Supoño que será por evitar problemas no futuro > Respondeu Sharostoff sobre por que escolleu ? Non, aínda non lle escrebín. > Non, no open-tran só escolles un idioma xa que presupón que o idioma > de orixe é o inglés. Iso era antes (hai moito), agora podes escoller a lingua de orixe e de partida. Simplesmente, por omisión está escollido o inglés como orixe. E xa postos, e non sería mellor colaborar con Nuno Veloso ? -- Best regards, MV
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
>> (non copies o TBX dos rusos que está mal!): > En que? Para empezar en que traduciron o "noun" de partOfSpeech ó ruso. Por outra banda temos o de poñer varios langSet do mesmo idioma dentro do mesmo termEntry (fixérono tanto co inglés coma co ruso), o que non estou seguro de que estea permitido... >> Por outra banda vexo que todos parecen ter a teima de querer usar >> e nunca o que xa me está empezando a cabrear xa que non >> ten sentido ningún :) > As diferenzas están en que a > = , [ | ] > > = , [], [] > > Vamos, que un ntig contén o termo, un texto referente a el, como o tig, pero > pode ser máis completo, e información, específica para o idioma, Pero esa información realmente non nos fai falta para nada. Toda a información que nos faga falta (e mais) pode ir dentro de . Respondeu Sharostoff sobre por que escolleu ? >> Vale. Agora só haberia que por a opción de escoller os idiomas que >> entrarian no glosario que te baixarias da web. > > Sasto! igualico que se pode facer ao consultar o open-tran.eu, so que ademais > coa opción de baixar a base de datos en formato TBX. Non, no open-tran só escolles un idioma xa que presupón que o idioma de orixe é o inglés. Co sistema proposto, ou co de Nuno, terias que escoller tanto o inglés coma o galego. Ata logo, Leandro Regueiro
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
O Mércores 26 Novembro 2008 13:09, Leandro Regueiro escribiu: > (non copies o TBX dos rusos que está mal!): En que? > Por outra banda vexo que todos parecen ter a teima de querer usar > e nunca o que xa me está empezando a cabrear xa que non > ten sentido ningún :) As diferenzas están en que a = , [ | ] = , [], [] Vamos, que un ntig contén o termo, un texto referente a el, como o tig, pero pode ser máis completo, e información, específica para o idioma, > Vale. Agora só haberia que por a opción de escoller os idiomas que > entrarian no glosario que te baixarias da web. Sasto! igualico que se pode facer ao consultar o open-tran.eu, so que ademais coa opción de baixar a base de datos en formato TBX. -- Best regards, MV
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
>> > Cal sería entón a estrutura "chachi" para unha termEntry? >> Pon o que consideras que debemos usar e punto. Que o 95% do estándar >> non o imos usar para nada. O teu exemplo eu poriao asi (non copies o TBX dos rusos que está mal!): a network of uniformly spaced horizontal and perpendicular lines (as for locating points on a map) ; also : something resembling such a network graphics design grid noun grella noun singular feminine grade noun singular feminine Ainda asi teño dúbidas no subjectField, que non sei se se poderá repetir. >> >Penso que debería consultar con Shafforo a ver >> > porque escolleu a) para o lokalise. >> >> Non sei quen é Shafforo, pero en canto teña tempo heille preguntar a >> Nuno que opción vai escoller, ainda que seguramente escolla a a), > Pois Shafforo é a Lokalise o que Nuno a globs, isto é, o mantenedor. Por curiosidade, onde demo está a páxina do lokalize, que ca mensaxe de Karl perdinme e intentei buscar capturas de pantalla, pero non atopei nada, nin sequera o sitio. Só aparecen cousas sobre kaider, e as capturas non se parecen moito ó que eu vin do lokalize. >> que é a que a nós non nos interesa para nada, xa que o seu sistema e para >> terminoloxia profesional. > E que? se supuxese moita diferenza na implementación aínda tería sentido tirar > a opción, mais tendo en conta que iso do que falabas é o que está a facer ese > tal Nuno, pois... Psi, pero é que me da rabia ver tantas etiquetas inútiles :) Estoulle preguntando a Nuno que vai facer, que agora está mirando o estándar e parece que non chegou ainda a esa parte. Por outra banda vexo que todos parecen ter a teima de querer usar e nunca o que xa me está empezando a cabrear xa que non ten sentido ningún :) >> Polo de agora só usamos un glosario inglés-galego, é que tes pensado >> incluir outros idiomas tamén? > Consulta o exemplo de Nuno: el xa tivo a mesma idea. E está implementada. > Pensa que isto é por pura economía: deste xeito a parte de elaborar as > entradas > en inglés distribúese entre os diferentes equipos dos distintos idiomas. O teu > equipo só tería que encargarse de por as súas entradas naquelas > de interese. Vale. Agora só haberia que por a opción de escoller os idiomas que entrarian no glosario que te baixarias da web. > Tal vez poda aportar algo, xa que hai relativamente pouco tempo estiven > explorando as ferramentas existentes para crear glosarios e dicionarios > online (especialmente multilingües). Eu destacaría: > >* OmegaWiki [1]: pretende solucionar os problemas de deseño do > Wiktionary (non existe realmente unha relación entre as palabras > nos distintos idiomas). > o É moi potente > o É relativamente complexo. > o Non hai un procedemento simple para facer unha instalación >fresca en local (sen tódolos termos que ten a versión de >Omegawiki). >* Glossword [2][3]: Máis simple, pero tamén máis fácil para instalar > e para usar. > > En resumo, que lle botedes un ollo ao Glossword a ver se se axusta. A ver se teño tempo para todo, que ainda estou a ver se lle boto un ollo ó Globs. Ata logo, Leandro Regueiro
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
mvillarino wrote: >> Polo de agora só usamos un glosario inglés-galego, é que tes pensado >> incluir outros idiomas tamén? >> > Consulta o exemplo de Nuno: el xa tivo a mesma idea. E está implementada. > Pensa que isto é por pura economía: deste xeito a parte de elaborar as > entradas > en inglés distribúese entre os diferentes equipos dos distintos idiomas. O teu > equipo só tería que encargarse de por as súas entradas naquelas > de interese. > Tal vez poda aportar algo, xa que hai relativamente pouco tempo estiven explorando as ferramentas existentes para crear glosarios e dicionarios online (especialmente multilingües). Eu destacaría: * OmegaWiki [1]: pretende solucionar os problemas de deseño do Wiktionary (non existe realmente unha relación entre as palabras nos distintos idiomas). o É moi potente o É relativamente complexo. o Non hai un procedemento simple para facer unha instalación fresca en local (sen tódolos termos que ten a versión de Omegawiki). * Glossword [2][3]: Máis simple, pero tamén máis fácil para instalar e para usar. En resumo, que lle botedes un ollo ao Glossword a ver se se axusta. Saúdos. Felipe. [1] http://www.omegawiki.org/ [2] http://code.google.com/p/glossword/ [3] http://glossword.biz/demo/
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
O Martes 25 Novembro 2008 21:16, Leandro Regueiro escribiu: > Non me parece raro que che saia unha mensaxe longa se nos pós aqui > todo o maldito estándar TBX reducido e resumido. Loxicamente, fai falla para que todo o mundo saiba ± do que estamos a falar. > Nunha crin que un > texto me puidera facer doer máis a cabeza ca un estándar da ISO, pero > Marce acaba de conseguilo. Bah, iso é porque nunca te viches as barbas cos auditores da iso 9000... > > Cal sería entón a estrutura "chachi" para unha termEntry? > Pon o que consideras que debemos usar e punto. Que o 95% do estándar > non o imos usar para nada. a network of uniformly spaced horizontal and perpendicular lines (as for locating points on a map) ; also : something resembling such a network graphics design grid noun grella noun singular feminine grade noun singular feminine > >Penso que debería consultar con Shafforo a ver > > porque escolleu a) para o lokalise. > > Non sei quen é Shafforo, pero en canto teña tempo heille preguntar a > Nuno que opción vai escoller, ainda que seguramente escolla a a), Pois Shafforo é a Lokalise o que Nuno a globs, isto é, o mantenedor. > que > é a que a nós non nos interesa para nada, xa que o seu sistema e para > terminoloxia profesional. E que? se supuxese moita diferenza na implementación aínda tería sentido tirar a opción, mais tendo en conta que iso do que falabas é o que está a facer ese tal Nuno, pois... > Polo de agora só usamos un glosario inglés-galego, é que tes pensado > incluir outros idiomas tamén? Consulta o exemplo de Nuno: el xa tivo a mesma idea. E está implementada. Pensa que isto é por pura economía: deste xeito a parte de elaborar as entradas en inglés distribúese entre os diferentes equipos dos distintos idiomas. O teu equipo só tería que encargarse de por as súas entradas naquelas de interese. > Pregunta, pregunta. Vale. -- Best regards, MV
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
>> Como vai longo, sigo en mensaxe filla Non me parece raro que che saia unha mensaxe longa se nos pós aqui todo o maldito estándar TBX reducido e resumido. Nunha crin que un texto me puidera facer doer máis a cabeza ca un estándar da ISO, pero Marce acaba de conseguilo. > Cal sería entón a estrutura "chachi" para unha termEntry? > Na , os typos da válidos son: >(para expresar propriedades e descricións de > conceitos) >audio >*definition >example >*explanation >figure >otherBinaryData >table >video >(para relacións entre conceitos) >todos os de 9.3.2 da especificación. Case > mellor deixalo estar. >(propriedades e descricións de termos) >reliabilityCode (ollo, ver a lista de > posibilidades na especificación:un número do 1 ao 10 >(subconxuntos) >*subjectField > --con (*) sinalo os que considero debe(mos) empregar. Pon o que consideras que debemos usar e punto. Que o 95% do estándar non o imos usar para nada. > Para cada , ou nalgún das distintas , pode ser > interesante empregar un campo , > cos tipos: >applicationSubset (e.g. Kword ou kate) >projectSubset (e.g. KDE ou GNOME) > Agora habería que escoller se empregar, dentro da langSet: >a) /, como > no lokalize, ou >b) >Penso que debería consultar con Shafforo a ver porque > escolleu a) para o lokalise. Non sei quen é Shafforo, pero en canto teña tempo heille preguntar a Nuno que opción vai escoller, ainda que seguramente escolla a a), que é a que a nós non nos interesa para nada, xa que o seu sistema e para terminoloxia profesional. > En calquera caso, a pode incluirse unha para o , como no > exemplo do final, pode levar anexo cousas como (poden ser intersantes): > dos tipos: conceptOrigin, e as xa vistas > " " : context, characteristic, explanation > : etymology, grammaticalGender, grammaticalNumber, > partOfSpeech, termType (dunha listaxe de escollas), > > As demais cousas, en ppio, seguramente non as precisemos para un dicionario > multilingüe básico.(1) Polo de agora só usamos un glosario inglés-galego, é que tes pensado incluir outros idiomas tamén? > E con iso, axeitadamente metido nunha base de datos con opción a obtención > dos resultados mediante xml-rpc, e unha interface para engadir entradas > (mesmo através da CATT), estaría listo. Xa lle enviei unha mensaxe a Nuno sobre este tema. > Se che parece ben, perguntolle iso a Shafforo. Pregunta, pregunta. > (1) Si, por que limitalo ao par inglés-galego, cando pode ser: área do > coñecimento, definición, inglés, galego, catalán, portugués etc. ? > -- > Best regards, > MV > > > > >authentication >noun > >. > > > > > >подтверждение подлинности >сущ. > > > > Eu xa digo que os rusos non o fixeron ben de todo, creo eu. A ver se remato de intentar sintetizar os usos que vin no noso glosario da wiki. Asi poderiamos xa discutir que é o que desbotamos e mailo que non. Ata logo, Leandro Regueiro
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
O Martes 25 Novembro 2008 21:14, mvillarino escribiu: > = type, xml:lang, , >= {} >= id, [ | | | > | | | | ], {} >= id, xml:lang, [ | | > | | | | | ], { | > } >= id, , [ | > | | | | | | ] >= id, , [], [ | > | | | | ] >= id, , [ | > ], [] >= id, xml:lang, type, > target, datatype, "texto" >= id, "texto" > [...] > Como vai longo, sigo en mensaxe filla > Seguimos logo. Cal sería entón a estrutura "chachi" para unha termEntry? Na , os typos da válidos son: (para expresar propriedades e descricións de conceitos) audio *definition example *explanation figure otherBinaryData table video (para relacións entre conceitos) todos os de 9.3.2 da especificación. Case mellor deixalo estar. (propriedades e descricións de termos) reliabilityCode (ollo, ver a lista de posibilidades na especificación:un número do 1 ao 10 (subconxuntos) *subjectField --con (*) sinalo os que considero debe(mos) empregar. Para cada , ou nalgún das distintas , pode ser interesante empregar un campo , cos tipos: applicationSubset (e.g. Kword ou kate) projectSubset (e.g. KDE ou GNOME) Agora habería que escoller se empregar, dentro da langSet: a) /, como no lokalize, ou b) Penso que debería consultar con Shafforo a ver porque escolleu a) para o lokalise. En calquera caso, a pode incluirse unha para o , como no exemplo do final, pode levar anexo cousas como (poden ser intersantes): dos tipos: conceptOrigin, e as xa vistas " " : context, characteristic, explanation : etymology, grammaticalGender, grammaticalNumber, partOfSpeech, termType (dunha listaxe de escollas), As demais cousas, en ppio, seguramente non as precisemos para un dicionario multilingüe básico.(1) E con iso, axeitadamente metido nunha base de datos con opción a obtención dos resultados mediante xml-rpc, e unha interface para engadir entradas (mesmo através da CATT), estaría listo. Se che parece ben, perguntolle iso a Shafforo. (1) Si, por que limitalo ao par inglés-galego, cando pode ser: área do coñecimento, definición, inglés, galego, catalán, portugués etc. ? -- Best regards, MV authentication noun . подтверждение подлинности сущ.
Re: @Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
Atopei isto antonte http://softwarelivre.sapo.pt/globs Falei con nuno e di que o remata cara febreiro/marzo do ano que ven. Non ven cas funcionalidades que nos interesan, pero a parte que permite discutir os termos está ben. Ainda non o probei pero xa creei unha conta no sandbox http://eremita.di.uminho.pt/terminologia/gl Que isto teña boa pinta non quere dicir que vaia ser o que rematemos usando, xa que non é exactamente o que nós precisamos (a parte do xml-rpc e iso non a ten) e nin sequera está rematado ainda. Pero conto con que a remate (creo que me dixo que era o seu PFC) e é GPL3. Todo isto non quere dicir que non teñamos que definir que estructura ten que ter o noso glosario. Por dicilo dalgún xeito temos que definir a guía de estilo para crear a terminoloxía e definir que información vai conter o noso glosario. Agora vou ler a túa mensaxe, Marce :) Ata logo, Leandro Regueiro
@Leandro: TBX server (xa podes ir dándolle que tes para un proxecto de fin de carreira)
Boas, a ver, tras matinar un pouco (realmente pouco, xa vos decataredes por vos mesmos), penso que unha estrutura correcta para o tbx on-line ese do que fala Leandro pode ser: = type, xml:lang, , = id, , [], [] (* toca sofrir a descrición do cabezallo *) = id, [], [], {} = id, xml:lang, , [note] = id, xml:lang, "texto" = id, xml:lang, "texto" = id, xml:lang, {} = id, xml:lang, {} = id, xml:lang, type, "texto" (* pozi, un parágrafo entre e *) = {} = id, [ | | | | | | | ], {} (*primeiro a informacion auxiliar *) = id, , [, , , transacGrp>, , , ] = id, xml:lang, type, target, datatype, "texto" = id, xml:lang, type, target, datatype, "texto" = id, xml:lang, type, target, datatype, "texto" = id, , [ | | | ] = id, xml:lang, type, target, datatype, "texto" = id, , [ | | | | ] = id, xml:lang, type, target, datatype, "texto" = id, xml:lang, type, target, datatype, "texto" = id, "texto" = id, xml:lang, "texto" = id, xml:lang, type, target, datatype, "texto" = id, type, target, "texto" = id, xml:lang, [ | | | | | | | ], { | } = id, , [ | | | | | | | ] = id, , [], [ | | | | | ] = id, , [ | ], [] = id, , | | | | | = id, type, [ | | | | | | | ], {|} = id, xml:lang, "texto" = id, , [|], [ | | | | | ] = id, xml:lang, type, target, datatype, "texto" = id, "texto" (* os que van entre <> son sun (sub-)entidades, etiquetas para os amigos, os que non son atributos que deben ir na entidade, "texto" indica un texto entre <> e e por desgraza pode ter cousas para representar xml dentro de xml *) (* os id deben ser CDATA, os xml:lang códigos de idioma e os target CDATA ou IDREF *) Como veredes, fan falla restricións para que cobre sentido (os XCS), indicando estas restricións que carallo _significa_ a información de cada "texto" Co XCS estándar: Os poden ser: -abbreviatedFormFor -administrativeStatus Unha de: -standardizedTerm-admn-sts -preferredTerm-admn-sts -admittedTerm-admn-sts -deprecatedTerm-admn-sts -supersededTerm-admn-sts -legalTerm-admn-sts -regulatedTerm-admn-sts -animacy Unha de: -animate -inaminate -otherAnimacy Os poden ser: -annotatedNote -applicationSubset -bussinessUnitSubset Os poden ser: -antonymConcept (en termEntry) -associatedConcept (en langSet e termEntry) -audio (en langSet termEntry e term; datos binarios) -broaderConceptGeneric (en langSet e termEntry) -broaderConceptpPartitive (en langSet e termEntry) -characteristic (en term) -classificationCode (en langSet termEntry e term) Os poden ser: -antonymTerm entre outros (ver páxina 17 a 21 do estándar) Como vai longo, sigo en mensaxe filla -- Best regards, MV