[G11n] Glosarios informatica en galego en formato TBX
Ola, acabo de ver hai un anaco que actualizaron o arquivo que hai en http://ghicho.iespana.es/ incluÃndo máis ficheiros e para tocar as narices cambiándolle os nomes. AÃnda asà en dez minutiños arranxei o script de creación da base de datos que xa tiña e xa está rulando outra vez, agora con máis datos. O script de consulta non cambiou nada, e segue as mesmas instruccións que xa puxen noutra mensaxe anterior e que vou copiar aquà embaixo para non vos marear: EnvÃovos unha nova versión que permite indicar as consultas como exactas ou inexactas. à dicir con ./script --fuzzy tab obtéñense tódolos resultados tal como se obtiñan antes, só que é bastante máis lento agora. Co exemplo este obterianse todas as entradas que teñan algunha tradución en inglés que conteña tab: table, executable, database, portable... Ca opción nova: ./script --exact tab só se obteñen as entradas que teñen algunha tradución en inglés que conteña tab e tab non forma parte de ningunha palabra con máis caracteres. Devolveria tab order, tab, next tab pero non tabulation nin nada diso. Lembrade que se pode consultar por frases, con ambos modos: ./script --exact database manager applet buscaria os resultados usando a cadea database manager applet. Importante, non me lembrei de borrar a liña esa que puxen para incluÃr unha copia do glosario de Marce, e que sobra do ficheiro de creación da base de datos a non ser que consigades o ficheiro dende http://websvn.kde.org/*checkout*/trunk/l10n-kde4/gl/terms.tbx e lle cambiedes o nome polo nome que está no código do script en Python. Outra opción é directamente eliminar a liña conflitiva, pero igual a Marce non lle gusta :) Ola de novo. EnvÃo a última versión dos scripts para poder xerar a base de datos incluÃndo o TBX da wiki de Mancomún e o do glosario de openSuse. Vai no anexo. próxima parte Borrouse unha mensaxe que non está en formato texto plano... Nome : scripts_para_crear_e_consultar_bd_glosarios_version5.tar.gz Tipo : application/x-gzip Tamaño : 5284 bytes Descrición: non dispoñible Url: http://listas.mancomun.org/pipermail/g11n/attachments/20091125/992f1c6a/attachment.bin
[G11n] Glosarios informatica en galego en formato TBX
Grazas Leandro, xa che comentarei como me vai. Non estaría de máis que os meteses na Forxa tamén. Se total desaparece nun tris. Ata logo, Leandro Regueiro
[G11n] Glosarios informatica en galego en formato TBX
O que seria útil agora sería ter unha interface web para poder consultar os glosarios. Penso que a idea de consultar directamente os ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria nada despois da trapallada que fixen eu co meu para devolver resultados exactos. Home, non creo que haxa moita diferenza na prática entre o tempo de execución dunha consulta SQL e unha Xquery (sobre un ficheiro duns 5 MiB e a súa BBDD equivalente) Non vou entrar ao trapo. Moi interesante o de usar o TBX para comprobar que a palabra si se traduce como recomenda o glosario. Seguro que nun futuro o imos usar a cotío se conseguimos montar unha infrastrutura que simplifique isto ao máximo. Ata logo, Leandro Regueiro
[G11n] Glosarios informatica en galego en formato TBX
Grazas, Fran. Avisarei así que teña lista unha versión mínimamente funcional. Unha aperta, ~manuel 2009/10/5 Fran Dieguez listas en mabishu.com -BEGIN PGP SIGNED MESSAGE- Hash: SHA1 Ola Manuel, recoméndoche que primeiro fagas a implementación que logo dos recursos para facelo accesibel é cuestión de falalo con organizacións que estamos no mundillo. Coido que se pode meter en algún servidor co que contemos. Sempre e cando o software sexa liberado claro... Saúdos. Manuel Souto Pico escribiu: Leandro, moitas grazas por compartires e distribuíres eses glosarios e os scripts, que probarei máis tarde. Eu tampouco prometo nada de nada, pero fixen una pequena proba con XQuery para crear unha interface para interrogar directamente os documentos TBX sen ter que pasalos primeiro a unha base de datos SQL. Teño un formulario de busca de termos que permite usar expresións regulares: ao buscar un termo, móstrase unha lista das coincidencias e ao clicar nalgunha, móstrase a ficha completa correspondente, máis outro formulario para introducir comentarios (pendente de acabar). Teño isto no meu servidor local, en eXist, así que non volo podo mostrar de momento. Estiven mirando e o meu provedor de aloxamento non me permite usar eXist nin Tamino ou similar, parece que para iso necesito un VPS ou servidor dedicado ou algo así, que é un pouco caro. Da Forxa tamén me responderon dicindo que non contemplan instalar ningún sistema de bd XML. Alguén pode recomendar algunha outra maneira de montar isto? Como o vedes? Credes que sería útil? Hai tempo que quería facer isto pero non tiña a materia prima (os glosarios). Unha aperta, ~manuel 2009/10/5 Leandro Regueiro leandro.regueiro en gmail.com mailto:leandro.regueiro en gmail.com É raro, pero o outro día rulábame ca ligazón directa, en todo caso con http://ghicho.iespana.es/ si que funciona. Como prometín no anexo vai un arquivo con tres ficheiros: un de instrucións, un script que xera a base de datos a partir dos ficheiros TBX que se poden baixar da páxina de enriba, e outro script que permite realizar consultas dende unha terminal. PD: acábome de dar conta de que o código do xerador inclúe unha referencia a un ficheiro TBX que me pasou Marce e que metin para probar e de paso ter máis terminoloxía na base de datos, así que pode que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente eliminade a liña referente ao glosario de Marce do dicionario que está cara o final do código do script xerador. Evidentemente cando teñamos rematado ese sistema de xestión de terminoloxía o uso desta ferramenta será útil para obter as propostas dos diferentes glosarios existentes ata o de agora e consideralas durante a creación da nova terminoloxía unificada, a cal debería ser a única que se debería usar nun futuro. Ou sexa, este sistema é un parche temporal. Chámalle documentar a escolla. Vale. Envíovos unha nova versión que permite indicar as consultas como exactas ou inexactas. É dicir con ./script --fuzzy tab obtéñense tódolos resultados tal como se obtiñan antes, só que é bastante máis lento agora. Co exemplo este obterianse todas as entradas que teñan algunha tradución en inglés que conteña tab: table, executable, database, portable... Ca opción nova: ./script --exact tab só se obteñen as entradas que teñen algunha tradución en inglés que conteña tab e tab non forma parte de ningunha palabra con máis caracteres. Devolveria tab order, tab, next tab pero non tabulation nin nada diso. Lembrade que se pode consultar por frases, con ambos modos: ./script --exact database manager applet buscaria os resultados usando a cadea database manager applet. E lamento o de que o script sexa moito máis lento. Quizais se teño tempo me dedicarei a ver se consigo que sexa máis rápido, pero non prometo nada de nada. Ata logo, Leandro Regueiro ___ G11n mailing list G11n en mancomun.org mailto:G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n ___ G11n mailing list G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n - -- Fran Diéguez http://www.mabishu.com - listas en mabishu.com GPG: 43DD 1B00 035F A764 4986 E695 98BB 6626 A2A4 F9B8 -BEGIN PGP SIGNATURE- Version: GnuPG v1.4.9 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
[G11n] Glosarios informatica en galego en formato TBX
Ei, Eu só comparto e distribúo os scripts. Os glosarios non os fixen eu. A min chegáronme por ti. O que seria útil agora sería ter unha interface web para poder consultar os glosarios. Pois iso (só consultar) en principio xa o teño. Despois desde casa mando unhas capturas para darvos unha idea. Penso que a idea de consultar directamente os ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria nada despois da trapallada que fixen eu co meu para devolver resultados exactos. No meu pódese buscar con regex, ou sexa que son todo o exactos ou inexactos que se queira. En todo caso agradécese o interese e o teu traballo e agardamos que se poida usar cedo. Si, mellor polas mañás... ;) Nada, a ver qué sai daí. Respecto á forxa, penso que tal como vai a cousa hai que considerar evitar meter alí nada, xa que o día menos agardado nos botan todo abaixo, pero non sen guerra pola nosa parte!! Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non está mal, pero se puidese ser gratis era mellor ;) En todo caso isto só se deberia usar como base para crear un glosario que xunte todo o importante e resolva as inconsistencias entre os glosarios recomendando unha opción, despois, claro está, de debatelo entre todos nós. Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda non acabei): Apertas, manuel próxima parte Borrouse un adxunto en formato HTML... URL: http://listas.mancomun.org/pipermail/g11n/attachments/20091005/29befdda/attachment.htm
[G11n] Glosarios informatica en galego en formato TBX
Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non está mal, pero se puidese ser gratis era mellor ;) Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é software libre é máis sinxelo. eXist é código aberto, e XML e XQuery son estándares do W3C. En todo caso isto só se deberia usar como base para crear un glosario que xunte todo o importante e resolva as inconsistencias entre os glosarios recomendando unha opción, despois, claro está, de debatelo entre todos nós. Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda non acabei): Interesante! Despois a ver como podemos usar isto no glósima para discutir. Que é o glósima? Manuel próxima parte Borrouse un adxunto en formato HTML... URL: http://listas.mancomun.org/pipermail/g11n/attachments/20091005/cbf1b79d/attachment.htm
[G11n] Glosarios informatica en galego en formato TBX
Manuel Souto Pico escribiu: Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non está mal, pero se puidese ser gratis era mellor ;) Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é software libre é máis sinxelo. eXist é código aberto, e XML e XQuery son estándares do W3C. En todo caso isto só se deberia usar como base para crear un glosario que xunte todo o importante e resolva as inconsistencias entre os glosarios recomendando unha opción, despois, claro está, de debatelo entre todos nós. Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda non acabei): Interesante! Despois a ver como podemos usar isto no glósima para discutir. Que é o glósima? Manuel ___ G11n mailing list G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n Podes sacar as túas propias ideas http://www.certima.net/glosima/?1-glosima -- Antón Gómez Méixome .:lingüista:. www.mancomun.org Centro de Referencia e Servizos de Software Libre Avda. de Vigo, s/n 15706 Santiago de Compostela Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 meixome @ mancomun.org
[G11n] Glosarios informatica en galego en formato TBX
É raro, pero o outro día rulábame ca ligazón directa, en todo caso con http://ghicho.iespana.es/ si que funciona. Como prometín no anexo vai un arquivo con tres ficheiros: un de instrucións, un script que xera a base de datos a partir dos ficheiros TBX que se poden baixar da páxina de enriba, e outro script que permite realizar consultas dende unha terminal. PD: acábome de dar conta de que o código do xerador inclúe unha referencia a un ficheiro TBX que me pasou Marce e que metin para probar e de paso ter máis terminoloxía na base de datos, así que pode que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente eliminade a liña referente ao glosario de Marce do dicionario que está cara o final do código do script xerador. Evidentemente cando teñamos rematado ese sistema de xestión de terminoloxía o uso desta ferramenta será útil para obter as propostas dos diferentes glosarios existentes ata o de agora e consideralas durante a creación da nova terminoloxía unificada, a cal debería ser a única que se debería usar nun futuro. Ou sexa, este sistema é un parche temporal. Ata logo, Leandro Regueiro
[G11n] Glosarios informatica en galego en formato TBX
Leandro Regueiro escribiu: É raro, pero o outro día rulábame ca ligazón directa, en todo caso con http://ghicho.iespana.es/ si que funciona. Como prometín no anexo vai un arquivo con tres ficheiros: un de instrucións, un script que xera a base de datos a partir dos ficheiros TBX que se poden baixar da páxina de enriba, e outro script que permite realizar consultas dende unha terminal. PD: acábome de dar conta de que o código do xerador inclúe unha referencia a un ficheiro TBX que me pasou Marce e que metin para probar e de paso ter máis terminoloxía na base de datos, así que pode que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente eliminade a liña referente ao glosario de Marce do dicionario que está cara o final do código do script xerador. Evidentemente cando teñamos rematado ese sistema de xestión de terminoloxía o uso desta ferramenta será útil para obter as propostas dos diferentes glosarios existentes ata o de agora e consideralas durante a creación da nova terminoloxía unificada, a cal debería ser a única que se debería usar nun futuro. Ou sexa, este sistema é un parche temporal. Ata logo, Leandro Regueiro ___ G11n mailing list G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n Chámalle documentar a escolla. -- Antón Gómez Méixome .:lingüista:. www.mancomun.org Centro de Referencia e Servizos de Software Libre Avda. de Vigo, s/n 15706 Santiago de Compostela Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 meixome @ mancomun.org
[G11n] Glosarios informatica en galego en formato TBX
Así aos poucos conseguín montar un script que colle ese ficheiros TBX e os mete todos xuntos nunha mesma base de datos, e despois fixen outro script para consultar a base de datos. O da consulta é bastante trapalleiro, pero supoño que outra xente con ansias pode arranxalo algo ou indicar ideas ou mesmo facer unha interface gráfica. Agora non teño tempo, pero envíovolo dentro duns poucos días. Ata logo, Leandro Regueiro
[G11n] Glosarios informatica en galego en formato TBX
Se o pos así si que vai, que cousas... http://ghicho.iespana.es/ Manuel Vázquez escribiu: Ola: Non vai este enderezo... Saúdos: Manuel A. Vázquez 2009/9/23 Leandro Regueiro leandro.regueiro en gmail.com mailto:leandro.regueiro en gmail.com http://ghicho.iespana.es/glosarios_vocabularios_informatica_galego_TBX.zip Ata logo, Leandro Regueiro ___ G11n mailing list G11n en mancomun.org mailto:G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n ___ G11n mailing list G11n en mancomun.org http://listas.mancomun.org/mailman/listinfo/g11n