[G11n] Glosarios informatica en galego en formato TBX

2009-11-25 Conversa Leandro Regueiro
 Ola,
 acabo de ver hai un anaco que actualizaron o arquivo que hai en
 http://ghicho.iespana.es/ incluíndo máis ficheiros e para tocar as
 narices cambiándolle os nomes.

 Aínda así en dez minutiños arranxei o script de creación da base de
 datos que xa tiña e xa está rulando outra vez, agora con máis datos. O
 script de consulta non cambiou nada, e segue as mesmas instruccións
 que xa puxen noutra mensaxe anterior e que vou copiar aquí embaixo
 para non vos marear:

 Envíovos unha nova versión que permite indicar as consultas como
 exactas ou inexactas. É dicir con

 ./script --fuzzy tab

 obtéñense tódolos resultados tal como se obtiñan antes, só que é
 bastante máis lento agora. Co exemplo este obterianse todas as
 entradas que teñan algunha tradución en inglés que conteña tab: table,
 executable, database, portable...

 Ca opción nova:

 ./script --exact tab

 só se obteñen as entradas que teñen algunha tradución en inglés que
 conteña tab e tab non forma parte de ningunha palabra con máis
 caracteres. Devolveria tab order, tab, next tab pero non
 tabulation nin nada diso.

 Lembrade que se pode consultar por frases, con ambos modos:

 ./script --exact database manager applet

 buscaria os resultados usando a cadea database manager applet.

 Importante, non me lembrei de borrar a liña esa que puxen para incluír
 unha copia do glosario de Marce, e que sobra do ficheiro de creación
 da base de datos a non ser que consigades o ficheiro dende
 http://websvn.kde.org/*checkout*/trunk/l10n-kde4/gl/terms.tbx e lle
 cambiedes o nome polo nome que está no código do script en Python.
 Outra opción é directamente eliminar a liña conflitiva, pero igual a
 Marce non lle gusta :)

Ola de novo.
Envío a última versión dos scripts para poder xerar a base de datos
incluíndo o TBX da wiki de Mancomún e o do glosario de openSuse. Vai
no anexo.
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios_version5.tar.gz
Tipo   : application/x-gzip
Tamaño : 5284 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091125/992f1c6a/attachment.bin
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-07 Conversa Leandro Regueiro
 Grazas Leandro, xa che comentarei como me vai.

 Non estaría de máis que os meteses na Forxa tamén.

Se total desaparece nun tris.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-06 Conversa Leandro Regueiro
 O que seria útil agora sería ter unha interface web para poder
 consultar os glosarios. Penso que a idea de consultar directamente os
 ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
 nada despois da trapallada que fixen eu co meu para devolver
 resultados exactos.

 Home, non creo que haxa moita diferenza na prática entre o tempo de execución
 dunha consulta SQL e unha Xquery (sobre un ficheiro duns 5 MiB e a súa BBDD
 equivalente)

Non vou entrar ao trapo.

Moi interesante o de usar o TBX para comprobar que a palabra si se
traduce como recomenda o glosario. Seguro que nun futuro o imos usar a
cotío se conseguimos montar unha infrastrutura que simplifique isto ao
máximo.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Conversa Manuel Souto Pico
Grazas, Fran. Avisarei así que teña lista unha versión mínimamente
funcional.

Unha aperta,
~manuel


2009/10/5 Fran Dieguez listas en mabishu.com

 -BEGIN PGP SIGNED MESSAGE-
 Hash: SHA1

 Ola Manuel,

 recoméndoche que primeiro fagas a implementación que logo dos recursos
 para facelo accesibel é cuestión de falalo con organizacións que estamos
 no mundillo. Coido que se pode meter en algún servidor co que contemos.

 Sempre e cando o software sexa liberado claro...

 Saúdos.

 Manuel Souto Pico escribiu:
  Leandro, moitas grazas por compartires e distribuíres eses glosarios e
  os scripts, que probarei máis tarde.
 
  Eu tampouco prometo nada de nada, pero fixen una pequena proba con
  XQuery para crear unha interface para interrogar directamente os
  documentos TBX sen ter que pasalos primeiro a unha base de datos SQL.
  Teño un formulario de busca de termos que permite usar expresións
  regulares: ao buscar un termo, móstrase unha lista das coincidencias e
  ao clicar nalgunha, móstrase a ficha completa correspondente, máis outro
  formulario para introducir comentarios (pendente de acabar).
 
  Teño isto no meu servidor local, en eXist, así que non volo podo mostrar
  de momento. Estiven mirando e o meu provedor de aloxamento non me
  permite usar eXist nin Tamino ou similar, parece que para iso necesito
  un VPS ou servidor dedicado ou algo así, que é un pouco caro. Da Forxa
  tamén me responderon dicindo que non contemplan instalar ningún sistema
  de bd XML. Alguén pode recomendar algunha outra maneira de montar isto?
 
  Como o vedes? Credes que sería útil? Hai tempo que quería facer isto
  pero non tiña a materia prima (os glosarios).
 
  Unha aperta,
  ~manuel
 
 
  2009/10/5 Leandro Regueiro leandro.regueiro en gmail.com
  mailto:leandro.regueiro en gmail.com
 
   É raro, pero o outro día rulábame ca ligazón directa, en todo
  caso con
   http://ghicho.iespana.es/ si que funciona.
  
   Como prometín no anexo vai un arquivo con tres ficheiros: un de
   instrucións, un script que xera a base de datos a partir dos
  ficheiros
   TBX que se poden baixar da páxina de enriba, e outro script que
   permite realizar consultas dende unha terminal.
  
   PD: acábome de dar conta de que o código do xerador inclúe unha
   referencia a un ficheiro TBX que me pasou Marce e que metin para
   probar e de paso ter máis terminoloxía na base de datos, así que
  pode
   que a vós non vos rule ben xa que non tedes ese ficheiro.
  Simplemente
   eliminade a liña referente ao glosario de Marce do dicionario
  que está
   cara o final do código do script xerador.
  
   Evidentemente cando teñamos rematado ese sistema de xestión de
   terminoloxía o uso desta ferramenta será útil para obter as
 propostas
   dos diferentes glosarios existentes ata o de agora e consideralas
   durante a creación da nova terminoloxía unificada, a cal debería
  ser a
   única que se debería usar nun futuro.
  
   Ou sexa, este sistema é un parche temporal.
  
   Chámalle documentar a escolla.
 
  Vale.
 
  Envíovos unha nova versión que permite indicar as consultas como
  exactas ou inexactas. É dicir con
 
  ./script --fuzzy tab
 
  obtéñense tódolos resultados tal como se obtiñan antes, só que é
  bastante máis lento agora. Co exemplo este obterianse todas as
  entradas que teñan algunha tradución en inglés que conteña tab:
 table,
  executable, database, portable...
 
  Ca opción nova:
 
  ./script --exact tab
 
  só se obteñen as entradas que teñen algunha tradución en inglés que
  conteña tab e tab non forma parte de ningunha palabra con máis
  caracteres. Devolveria tab order, tab, next tab pero non
  tabulation nin nada diso.
 
  Lembrade que se pode consultar por frases, con ambos modos:
 
  ./script --exact database manager applet
 
  buscaria os resultados usando a cadea database manager applet.
 
  E lamento o de que o script sexa moito máis lento. Quizais se teño
  tempo me dedicarei a ver se consigo que sexa máis rápido, pero non
  prometo nada de nada.
 
  Ata logo,
   Leandro Regueiro
  ___
  G11n mailing list
  G11n en mancomun.org mailto:G11n en mancomun.org
  http://listas.mancomun.org/mailman/listinfo/g11n
 
 
 
  
 
  ___
  G11n mailing list
  G11n en mancomun.org
  http://listas.mancomun.org/mailman/listinfo/g11n


 - --
 Fran Diéguez
 http://www.mabishu.com - listas en mabishu.com
 GPG: 43DD 1B00 035F A764 4986  E695 98BB 6626 A2A4 F9B8


 -BEGIN PGP SIGNATURE-
 Version: GnuPG v1.4.9 (GNU/Linux)
 Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

 

[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Conversa Manuel Souto Pico
Ei,



 Eu só comparto e distribúo os scripts. Os glosarios non os fixen eu.


A min chegáronme por ti.



 O que seria útil agora sería ter unha interface web para poder
 consultar os glosarios.


Pois iso (só consultar) en principio xa o teño. Despois desde casa mando
unhas capturas para darvos unha idea.


 Penso que a idea de consultar directamente os
 ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
 nada despois da trapallada que fixen eu co meu para devolver
 resultados exactos.


No meu pódese buscar con regex, ou sexa que son todo o exactos ou inexactos
que se queira.


 En todo caso agradécese o interese e o teu traballo e agardamos que se
 poida usar cedo.


Si, mellor polas mañás... ;) Nada, a ver qué sai daí.


 Respecto á forxa, penso que tal como vai a cousa hai que considerar
 evitar meter alí nada, xa que o día menos agardado nos botan todo
 abaixo, pero non sen guerra pola nosa parte!!


Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun
servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non
está mal, pero se puidese ser gratis era mellor ;)


 En todo caso isto só se deberia usar como base para crear un glosario
 que xunte todo o importante e resolva as inconsistencias entre os
 glosarios recomendando unha opción, despois, claro está, de debatelo
 entre todos nós.


Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda
non acabei):

Apertas,
manuel
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091005/29befdda/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Conversa Manuel Souto Pico


 
  Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción
 dun
  servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non
  está mal, pero se puidese ser gratis era mellor ;)

 Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é
 software libre é máis sinxelo.


eXist é código aberto, e XML e XQuery son estándares do W3C.


  En todo caso isto só se deberia usar como base para crear un glosario
  que xunte todo o importante e resolva as inconsistencias entre os
  glosarios recomendando unha opción, despois, claro está, de debatelo
  entre todos nós.
 
  Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda
  non acabei):

 Interesante! Despois a ver como podemos usar isto no glósima para discutir.


Que é o glósima?

Manuel
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091005/cbf1b79d/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Conversa Antón Méixome
Manuel Souto Pico escribiu:


 
  Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei
 a opción dun
  servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao
 mes, non
  está mal, pero se puidese ser gratis era mellor ;)

 Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é
 software libre é máis sinxelo.


 eXist é código aberto, e XML e XQuery son estándares do W3C.


  En todo caso isto só se deberia usar como base para crear un
 glosario
  que xunte todo o importante e resolva as inconsistencias entre os
  glosarios recomendando unha opción, despois, claro está, de
 debatelo
  entre todos nós.
 
  Esa é a idea de inserir comentarios no documento TBX (é a parte
 que aínda
  non acabei):

 Interesante! Despois a ver como podemos usar isto no glósima para
 discutir.


 Que é o glósima?

 Manuel

 

 ___
 G11n mailing list
 G11n en mancomun.org
 http://listas.mancomun.org/mailman/listinfo/g11n
   
Podes sacar as túas propias ideas

http://www.certima.net/glosima/?1-glosima


-- 
Antón Gómez Méixome  .:lingüista:.  www.mancomun.org 
Centro de Referencia e Servizos de Software Libre 
Avda. de Vigo, s/n 15706   Santiago de Compostela  
Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 meixome @ mancomun.org



[G11n] Glosarios informatica en galego en formato TBX

2009-09-30 Conversa Leandro Regueiro
 É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
 http://ghicho.iespana.es/ si que funciona.

 Como prometín no anexo vai un arquivo con tres ficheiros: un de
 instrucións, un script que xera a base de datos a partir dos ficheiros
 TBX que se poden baixar da páxina de enriba, e outro script que
 permite realizar consultas dende unha terminal.

 PD: acábome de dar conta de que o código do xerador inclúe unha
 referencia a un ficheiro TBX que me pasou Marce e que metin para
 probar e de paso ter máis terminoloxía na base de datos, así que pode
 que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
 eliminade a liña referente ao glosario de Marce do dicionario que está
 cara o final do código do script xerador.

Evidentemente cando teñamos rematado ese sistema de xestión de
terminoloxía o uso desta ferramenta será útil para obter as propostas
dos diferentes glosarios existentes ata o de agora e consideralas
durante a creación da nova terminoloxía unificada, a cal debería ser a
única que se debería usar nun futuro.

Ou sexa, este sistema é un parche temporal.

Ata logo,
   Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-09-30 Conversa Antón Méixome
Leandro Regueiro escribiu:
 É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
 http://ghicho.iespana.es/ si que funciona.

 Como prometín no anexo vai un arquivo con tres ficheiros: un de
 instrucións, un script que xera a base de datos a partir dos ficheiros
 TBX que se poden baixar da páxina de enriba, e outro script que
 permite realizar consultas dende unha terminal.

 PD: acábome de dar conta de que o código do xerador inclúe unha
 referencia a un ficheiro TBX que me pasou Marce e que metin para
 probar e de paso ter máis terminoloxía na base de datos, así que pode
 que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
 eliminade a liña referente ao glosario de Marce do dicionario que está
 cara o final do código do script xerador.
 

 Evidentemente cando teñamos rematado ese sistema de xestión de
 terminoloxía o uso desta ferramenta será útil para obter as propostas
 dos diferentes glosarios existentes ata o de agora e consideralas
 durante a creación da nova terminoloxía unificada, a cal debería ser a
 única que se debería usar nun futuro.

 Ou sexa, este sistema é un parche temporal.

 Ata logo,
Leandro Regueiro
 ___
 G11n mailing list
 G11n en mancomun.org
 http://listas.mancomun.org/mailman/listinfo/g11n

   
Chámalle documentar a escolla.

-- 
Antón Gómez Méixome  .:lingüista:.  www.mancomun.org 
Centro de Referencia e Servizos de Software Libre 
Avda. de Vigo, s/n 15706   Santiago de Compostela  
Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 meixome @ mancomun.org



[G11n] Glosarios informatica en galego en formato TBX

2009-09-29 Conversa Leandro Regueiro
Así aos poucos conseguín montar un script que colle ese ficheiros TBX
e os mete todos xuntos nunha mesma base de datos, e despois fixen
outro script para consultar a base de datos. O da consulta é bastante
trapalleiro, pero supoño que outra xente con ansias pode arranxalo
algo ou indicar ideas ou mesmo facer unha interface gráfica. Agora non
teño tempo, pero envíovolo dentro duns poucos días.

Ata logo,
Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-09-23 Conversa Méixome
Se o pos así si que vai, que cousas...

http://ghicho.iespana.es/


Manuel Vázquez escribiu:
 Ola:
 Non vai este enderezo...
 Saúdos:
 Manuel A. Vázquez

 2009/9/23 Leandro Regueiro leandro.regueiro en gmail.com 
 mailto:leandro.regueiro en gmail.com

 http://ghicho.iespana.es/glosarios_vocabularios_informatica_galego_TBX.zip

 Ata logo,
Leandro Regueiro
 ___
 G11n mailing list
 G11n en mancomun.org mailto:G11n en mancomun.org
 http://listas.mancomun.org/mailman/listinfo/g11n


 

 ___
 G11n mailing list
 G11n en mancomun.org
 http://listas.mancomun.org/mailman/listinfo/g11n