Re: [RFC] LanguageTool
O Domingo, 18 de Outubro de 2009 13:54:11 Leandro Regueiro escribiu: > > Anímase alguén a converter as regras do Golfiño en regras do > > LanguageTool? #!/usr/bin/env python # -*- coding: utf-8 -*- # Versión moi preliminar # Licenza BSD como aparece en http://www.opensource.org/licenses/bsd- license.php # con # = A.C. Proxecto Trasno # = A.C. Proxecto Trasno # = 2009 def procesaPadronErro(cadea): #a chave das noces if cadea.count("+") == 0: for palabra in cadea.split(" "): print ""+palabra+"" else: for palabra in cadea.split("+"): print ""+palabra+"" print """ """ print "" acumulador = [] for linha in open("erroutf.txt"): contido = linha.split("|")[0:5] if contido[0].upper() not in acumulador: acumulador.append(contido[0].upper()) print "" print " " procesaPadronErro(contido[0]) print " " print " "+contido[4]+"" print " "+contido[3]+"" print " "+contido[1]+"" print "" print print "" print "" Falla en procesaPadronErro, que na forma actual é moi sinxelo e en consecuencia non cacha máis que coincidencias exactas, sen flexión ningunha > Nun momento dado habería que facer algo de documentación sobre como > usar o pology e todo iso, mellor que documentación unha especie de > xornadas ou cursos. A min interésame moito isto pero non sei por onde > collelo. rtfm Pology, nas cousas básicas, funciona moi ben: estatísticas, comproba as etiquetas, permite empregar o Apertium, facer comprobacións subtís (... case todo o que lle pidas, se creas uns ficheiros de configuración, claro). Está escrito integramente en python, e está a disposición do público en... kde, claro, que por algo son un celote, e xa lle fixen publicidade outras veces. Integralo nas CAT? Nicolás fixo case o contrario, integrar lokalize en pology :-), por acabar axiña, claro. > Non estaría mal que todo isto viñera integrado en varias das > ferramentas que usamos sen ter que facelo nós a man. LanguageTool é nacido para estar integrado no OO.org, as demais utilidades son como cuchipandadas.
Re: [RFC] LanguageTool
2009/10/18 Fran Dieguez : > >> Échevos moi interesante. Que poidamos corrixir as traducións non só >> cun corrector ortográfico, mirando que segundo a terminoloxía usamos a >> tradución recomendada, etc, senón que ademais poidamos comprobar que >> está escrito correctamente, gramaticalmente, sería un gran paso >> adiante. > > A verdade e que si, marce xa que lle estas votando un ollo escribir un pouco > sobre como son as normas de cada lugar así podemos entrar algunha xente que > non temos moito tempo para lernos a especificación enteira e inserir normas > de forma sinxela. >> >> Nun momento dado habería que facer algo de documentación sobre como >> usar o pology e todo iso, mellor que documentación unha especie de >> xornadas ou cursos. A min interésame moito isto pero non sei por onde >> collelo. Non estaría mal que todo isto viñera integrado en varias das >> ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son >> un seareiro da lei do mínimo esforzo, pero hai que considerar que isto >> sería especialmente útil para os tradutores recén chegados que son os >> que máis erros cometen. > > Totalmente de acordo no das xornadas. > > Empaquetar nun deb podo facelo eu sempre que se me explique como compilar as > cousas. Podo mirar eu como facer a compilación pero é o que máis me leva. > Empaquetar logo do que levo estudado sobre o mesmo (que non é pouco) é moi > sinxelo (para min). > > Asi que como vedes eu podo colaborar pero se me facedes un previo traballo > de simplificación da lectura da documentación para axilizar. > > De feito sería moi interesante dentro da asociación que para cada proxecto > se destine unha persoa que estude un pouco como está a situación de cada > proxecto e logo de xerar "un pouco" de info e documentación se unan o resto, > evitando que non sexan arañados polos "matorrais de silvas". Eu xa me rabuñei un pouco co do TBX e menos mal que nalgúns momentos Antón (e Marce tamén) nos aclarou outras cousas que senón eu e jchaves teriamos desistido... ou eu polo menos. Ata logo, Leandro Regueiro
Re: [RFC] LanguageTool
Échevos moi interesante. Que poidamos corrixir as traducións non só cun corrector ortográfico, mirando que segundo a terminoloxía usamos a tradución recomendada, etc, senón que ademais poidamos comprobar que está escrito correctamente, gramaticalmente, sería un gran paso adiante. A verdade e que si, marce xa que lle estas votando un ollo escribir un pouco sobre como son as normas de cada lugar así podemos entrar algunha xente que non temos moito tempo para lernos a especificación enteira e inserir normas de forma sinxela. Nun momento dado habería que facer algo de documentación sobre como usar o pology e todo iso, mellor que documentación unha especie de xornadas ou cursos. A min interésame moito isto pero non sei por onde collelo. Non estaría mal que todo isto viñera integrado en varias das ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son un seareiro da lei do mínimo esforzo, pero hai que considerar que isto sería especialmente útil para os tradutores recén chegados que son os que máis erros cometen. Totalmente de acordo no das xornadas. Empaquetar nun deb podo facelo eu sempre que se me explique como compilar as cousas. Podo mirar eu como facer a compilación pero é o que máis me leva. Empaquetar logo do que levo estudado sobre o mesmo (que non é pouco) é moi sinxelo (para min). Asi que como vedes eu podo colaborar pero se me facedes un previo traballo de simplificación da lectura da documentación para axilizar. De feito sería moi interesante dentro da asociación que para cada proxecto se destine unha persoa que estude un pouco como está a situación de cada proxecto e logo de xerar "un pouco" de info e documentación se unan o resto, evitando que non sexan arañados polos "matorrais de silvas". Saúdos
Re: [RFC] LanguageTool
2009/10/18 marce : > Olá, > > > onte non foi só Chaves O'Ilexítimo (que manda carallo que lle chamemos chaves > apelidado como é Castroagudín Silva), e supoño que tamén Chaves O'Chaves os > que se deitasen tarde. Eu demoreime a facer unhas probas referentes ao tema > pouco tratado do corrector gramatical. > > > Consideremos dous dos correctores gramaticais libres dispoñíbeis para o > galego: Golfiño e LanguageTool (LT), ambos os dous baseados en procurar > padróns(*) de erro. O primeiro é unha ferramenta feita ad-hoc e polo tanto é > pouco probábel que chegue a estar entre as «commodities». O segundo está > escrito en Java, o que non me fai moita graza pensando na súa universalidade, > pero é o que hai, e dispón das bases precisas para realizar corrección > gramatical ao galego, sendo a mantenedora e desenvolvedora ppal Susana Sotelo > (SSD). > Fáiseme coñecido o nome > > Tras pelexar co LT e lograr instalalo e configuralo para empregalo tanto coa > súa GUI independente como desde dentro do OO.org, vexo dúas cousas: > 1.- FUNCIONA !!! > 2.- Cona, que funciona moito mellor do que agardada polo que lin na wiki de > SSD ! > (e 3, que non o dou feito rular dentro do pology, pero todo se ha andar) > Tras argallar outro pouco, pois vin que hai moito máis traballo feito do que > inicialmente parecía, hai un dicionario tomado do FreeLing (FL), evidentemente > máis extenso que o de probas que tiña tres palabras, e as regras son xa moito > máis ca un xoguete de proba de concepto. > > SSD na súa wiki falaba de converter as regras do Golfiño en regras do LT, e > creo que non é complicado, apesar de que a documentación referente ás > etiquetas e parámetros que compoñen as regras do LT é mediocre, a xulgar pola > enorme diferenza entre o que se explica na súa web e o que aparece nos > ficheiros de regras das fontes do programa. > > Por non estenderme de máis: > > Anímase alguén a converter as regras do Golfiño en regras do LanguageTool? Échevos moi interesante. Que poidamos corrixir as traducións non só cun corrector ortográfico, mirando que segundo a terminoloxía usamos a tradución recomendada, etc, senón que ademais poidamos comprobar que está escrito correctamente, gramaticalmente, sería un gran paso adiante. Nun momento dado habería que facer algo de documentación sobre como usar o pology e todo iso, mellor que documentación unha especie de xornadas ou cursos. A min interésame moito isto pero non sei por onde collelo. Non estaría mal que todo isto viñera integrado en varias das ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son un seareiro da lei do mínimo esforzo, pero hai que considerar que isto sería especialmente útil para os tradutores recén chegados que son os que máis erros cometen. > (*)Digalego dixit: > Padrón: 3 s m Modelo que se toma como exemplo a > seguir. > Patrón: 7 1 s m Modelo, xeralmente de papel, a > partir do que > se fan elementos semellantes. Anotado queda. Ata logo, Leandro Regueiro
[RFC] LanguageTool
Olá, onte non foi só Chaves O'Ilexítimo (que manda carallo que lle chamemos chaves apelidado como é Castroagudín Silva), e supoño que tamén Chaves O'Chaves os que se deitasen tarde. Eu demoreime a facer unhas probas referentes ao tema pouco tratado do corrector gramatical. Consideremos dous dos correctores gramaticais libres dispoñíbeis para o galego: Golfiño e LanguageTool (LT), ambos os dous baseados en procurar padróns(*) de erro. O primeiro é unha ferramenta feita ad-hoc e polo tanto é pouco probábel que chegue a estar entre as «commodities». O segundo está escrito en Java, o que non me fai moita graza pensando na súa universalidade, pero é o que hai, e dispón das bases precisas para realizar corrección gramatical ao galego, sendo a mantenedora e desenvolvedora ppal Susana Sotelo (SSD). Fáiseme coñecido o nome Tras pelexar co LT e lograr instalalo e configuralo para empregalo tanto coa súa GUI independente como desde dentro do OO.org, vexo dúas cousas: 1.- FUNCIONA !!! 2.- Cona, que funciona moito mellor do que agardada polo que lin na wiki de SSD ! (e 3, que non o dou feito rular dentro do pology, pero todo se ha andar) Tras argallar outro pouco, pois vin que hai moito máis traballo feito do que inicialmente parecía, hai un dicionario tomado do FreeLing (FL), evidentemente máis extenso que o de probas que tiña tres palabras, e as regras son xa moito máis ca un xoguete de proba de concepto. SSD na súa wiki falaba de converter as regras do Golfiño en regras do LT, e creo que non é complicado, apesar de que a documentación referente ás etiquetas e parámetros que compoñen as regras do LT é mediocre, a xulgar pola enorme diferenza entre o que se explica na súa web e o que aparece nos ficheiros de regras das fontes do programa. Por non estenderme de máis: Anímase alguén a converter as regras do Golfiño en regras do LanguageTool? (*)Digalego dixit: Padrón: 3s m Modelo que se toma como exemplo a seguir. Patrón: 7 1 s m Modelo, xeralmente de papel, a partir do que se fan elementos semellantes.