Re: [RFC] LanguageTool

2009-10-18 Conversa marce
O Domingo, 18 de Outubro de 2009 13:54:11 Leandro Regueiro escribiu:
> > Anímase alguén a converter as regras do Golfiño en regras do
> > LanguageTool?

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Versión moi preliminar
# Licenza BSD como aparece en http://www.opensource.org/licenses/bsd-
license.php
# con 
# = A.C. Proxecto Trasno
#  = A.C. Proxecto Trasno
#  = 2009

def procesaPadronErro(cadea):
  #a chave das noces
  if cadea.count("+") == 0:
 for palabra in cadea.split(" "):
   print ""+palabra+""
  else:
 for palabra in cadea.split("+"):
   print ""+palabra+""


print """



"""
print ""
acumulador = []
for linha in open("erroutf.txt"):
  contido = linha.split("|")[0:5]
  if contido[0].upper() not in acumulador:
acumulador.append(contido[0].upper())
print ""
print "  "
procesaPadronErro(contido[0])
print "  "
print "  "+contido[4]+""
print "  "+contido[3]+""
print "  "+contido[1]+""
print ""
print
print ""
print ""

Falla en procesaPadronErro, que na forma actual é moi sinxelo e en 
consecuencia non cacha máis que coincidencias exactas, sen flexión ningunha

> Nun momento dado habería que facer algo de documentación sobre como
> usar o pology e todo iso, mellor que documentación unha especie de
> xornadas ou cursos. A min interésame moito isto pero non sei por onde
> collelo.

 rtfm 

Pology, nas cousas básicas, funciona moi ben: estatísticas, comproba as 
etiquetas, permite empregar o Apertium, facer comprobacións subtís (... case 
todo o que lle pidas, se creas uns ficheiros de configuración, claro). Está 
escrito integramente en python, e está a disposición do público en... kde, 
claro, que por algo son un celote, e xa lle fixen publicidade outras veces.

Integralo nas CAT? Nicolás fixo case o contrario, integrar lokalize en pology 
:-), por acabar axiña, claro.

> Non estaría mal que todo isto viñera integrado en varias das
> ferramentas que usamos sen ter que facelo nós a man.
LanguageTool é nacido para estar integrado no OO.org, as demais utilidades son 
como cuchipandadas.


Re: [RFC] LanguageTool

2009-10-18 Conversa Leandro Regueiro
2009/10/18 Fran Dieguez :
>
>> Échevos moi interesante. Que poidamos corrixir as traducións non só
>> cun corrector ortográfico, mirando que segundo a terminoloxía usamos a
>> tradución recomendada, etc, senón que ademais poidamos comprobar que
>> está escrito correctamente, gramaticalmente, sería un gran paso
>> adiante.
>
> A verdade e que si, marce xa que lle estas votando un ollo escribir un pouco
> sobre como son as normas de cada lugar así podemos entrar algunha xente que
> non temos moito tempo para lernos a especificación enteira e inserir normas
> de forma sinxela.
>>
>> Nun momento dado habería que facer algo de documentación sobre como
>> usar o pology e todo iso, mellor que documentación unha especie de
>> xornadas ou cursos. A min interésame moito isto pero non sei por onde
>> collelo. Non estaría mal que todo isto viñera integrado en varias das
>> ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son
>> un seareiro da lei do mínimo esforzo, pero hai que considerar que isto
>> sería especialmente útil para os tradutores recén chegados que son os
>> que máis erros cometen.
>
> Totalmente de acordo no das xornadas.
>
> Empaquetar nun deb podo facelo eu sempre que se me explique como compilar as
> cousas. Podo mirar eu como facer a compilación pero é o que máis me leva.
> Empaquetar logo do que levo estudado sobre o mesmo (que non é pouco) é moi
> sinxelo (para min).
>
> Asi que como vedes eu podo colaborar pero se me facedes un previo traballo
> de simplificación da lectura da documentación para axilizar.
>
> De feito sería moi interesante dentro da asociación que para cada proxecto
> se destine unha persoa que estude un pouco como está a situación de cada
> proxecto e logo de xerar "un pouco" de info e documentación se unan o resto,
> evitando que non sexan arañados polos "matorrais de silvas".

Eu xa me rabuñei un pouco co do TBX e menos mal que nalgúns momentos
Antón (e Marce tamén) nos aclarou outras cousas que senón eu e jchaves
teriamos desistido... ou eu polo menos.

Ata logo,
Leandro Regueiro


Re: [RFC] LanguageTool

2009-10-18 Conversa Fran Dieguez



Échevos moi interesante. Que poidamos corrixir as traducións non só
cun corrector ortográfico, mirando que segundo a terminoloxía usamos a
tradución recomendada, etc, senón que ademais poidamos comprobar que
está escrito correctamente, gramaticalmente, sería un gran paso
adiante.
A verdade e que si, marce xa que lle estas votando un ollo escribir un 
pouco sobre como son as normas de cada lugar así podemos entrar algunha 
xente que non temos moito tempo para lernos a especificación enteira e 
inserir normas de forma sinxela.


Nun momento dado habería que facer algo de documentación sobre como
usar o pology e todo iso, mellor que documentación unha especie de
xornadas ou cursos. A min interésame moito isto pero non sei por onde
collelo. Non estaría mal que todo isto viñera integrado en varias das
ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son
un seareiro da lei do mínimo esforzo, pero hai que considerar que isto
sería especialmente útil para os tradutores recén chegados que son os
que máis erros cometen.


Totalmente de acordo no das xornadas.

Empaquetar nun deb podo facelo eu sempre que se me explique como 
compilar as cousas. Podo mirar eu como facer a compilación pero é o que 
máis me leva. Empaquetar logo do que levo estudado sobre o mesmo (que 
non é pouco) é moi sinxelo (para min).


Asi que como vedes eu podo colaborar pero se me facedes un previo 
traballo de simplificación da lectura da documentación para axilizar.


De feito sería moi interesante dentro da asociación que para cada 
proxecto se destine unha persoa que estude un pouco como está a 
situación de cada proxecto e logo de xerar "un pouco" de info e 
documentación se unan o resto, evitando que non sexan arañados polos 
"matorrais de silvas".


Saúdos


Re: [RFC] LanguageTool

2009-10-18 Conversa Leandro Regueiro
2009/10/18 marce :
> Olá,
>
> 
> onte non foi só Chaves O'Ilexítimo (que manda carallo que lle chamemos chaves
> apelidado como é Castroagudín Silva), e supoño que tamén Chaves O'Chaves os
> que se deitasen tarde. Eu demoreime a facer unhas probas referentes ao tema
> pouco tratado do corrector gramatical.
> 
>
> Consideremos dous dos correctores gramaticais libres dispoñíbeis para o
> galego: Golfiño e LanguageTool (LT), ambos os dous baseados en procurar
> padróns(*) de erro. O primeiro é unha ferramenta feita ad-hoc e polo tanto é
> pouco probábel que chegue a estar entre as «commodities». O segundo está
> escrito en Java, o que non me fai moita graza pensando na súa universalidade,
> pero é o que hai, e dispón das bases precisas para realizar corrección
> gramatical ao galego, sendo a mantenedora e desenvolvedora ppal Susana Sotelo
> (SSD).
> Fáiseme coñecido o nome
>
> Tras pelexar co LT e lograr instalalo e configuralo para empregalo tanto coa
> súa GUI independente como desde dentro do OO.org, vexo dúas cousas:
> 1.- FUNCIONA !!!
> 2.- Cona, que funciona moito mellor do que agardada polo que lin na wiki de
> SSD !
> (e 3, que non o dou feito rular dentro do pology, pero todo se ha andar)
> Tras argallar outro pouco, pois vin que hai moito máis traballo feito do que
> inicialmente parecía, hai un dicionario tomado do FreeLing (FL), evidentemente
> máis extenso que o de probas que tiña tres palabras, e as regras son xa moito
> máis ca un xoguete de proba de concepto.
>
> SSD na súa wiki falaba de converter as regras do Golfiño en regras do LT, e
> creo que non é complicado, apesar de que a documentación referente ás
> etiquetas e parámetros que compoñen as regras do LT é mediocre, a xulgar pola
> enorme diferenza entre o que se explica na súa web e o que aparece nos
> ficheiros de regras das fontes do programa.
>
> Por non estenderme de máis:
>
> Anímase alguén a converter as regras do Golfiño en regras do LanguageTool?

Échevos moi interesante. Que poidamos corrixir as traducións non só
cun corrector ortográfico, mirando que segundo a terminoloxía usamos a
tradución recomendada, etc, senón que ademais poidamos comprobar que
está escrito correctamente, gramaticalmente, sería un gran paso
adiante.

Nun momento dado habería que facer algo de documentación sobre como
usar o pology e todo iso, mellor que documentación unha especie de
xornadas ou cursos. A min interésame moito isto pero non sei por onde
collelo. Non estaría mal que todo isto viñera integrado en varias das
ferramentas que usamos sen ter que facelo nós a man. Xa vedes que son
un seareiro da lei do mínimo esforzo, pero hai que considerar que isto
sería especialmente útil para os tradutores recén chegados que son os
que máis erros cometen.

> (*)Digalego dixit:
>                        Padrón: 3    s m   Modelo que se toma como exemplo a 
> seguir.
>                        Patrón: 7  1   s m  Modelo, xeralmente de papel, a 
> partir do que
> se fan elementos semellantes.

Anotado queda.

Ata logo,
 Leandro Regueiro


[RFC] LanguageTool

2009-10-18 Conversa marce
Olá,


onte non foi só Chaves O'Ilexítimo (que manda carallo que lle chamemos chaves 
apelidado como é Castroagudín Silva), e supoño que tamén Chaves O'Chaves os 
que se deitasen tarde. Eu demoreime a facer unhas probas referentes ao tema 
pouco tratado do corrector gramatical.


Consideremos dous dos correctores gramaticais libres dispoñíbeis para o 
galego: Golfiño e LanguageTool (LT), ambos os dous baseados en procurar 
padróns(*) de erro. O primeiro é unha ferramenta feita ad-hoc e polo tanto é 
pouco probábel que chegue a estar entre as «commodities». O segundo está 
escrito en Java, o que non me fai moita graza pensando na súa universalidade, 
pero é o que hai, e dispón das bases precisas para realizar corrección 
gramatical ao galego, sendo a mantenedora e desenvolvedora ppal Susana Sotelo 
(SSD).
Fáiseme coñecido o nome

Tras pelexar co LT e lograr instalalo e configuralo para empregalo tanto coa 
súa GUI independente como desde dentro do OO.org, vexo dúas cousas:
1.- FUNCIONA !!!
2.- Cona, que funciona moito mellor do que agardada polo que lin na wiki de 
SSD !
(e 3, que non o dou feito rular dentro do pology, pero todo se ha andar)
Tras argallar outro pouco, pois vin que hai moito máis traballo feito do que 
inicialmente parecía, hai un dicionario tomado do FreeLing (FL), evidentemente 
máis extenso que o de probas que tiña tres palabras, e as regras son xa moito 
máis ca un xoguete de proba de concepto.

SSD na súa wiki falaba de converter as regras do Golfiño en regras do LT, e 
creo que non é complicado, apesar de que a documentación referente ás 
etiquetas e parámetros que compoñen as regras do LT é mediocre, a xulgar pola 
enorme diferenza entre o que se explica na súa web e o que aparece nos 
ficheiros de regras das fontes do programa.

Por non estenderme de máis:

Anímase alguén a converter as regras do Golfiño en regras do LanguageTool?

(*)Digalego dixit:
Padrón: 3s m   Modelo que se toma como exemplo a 
seguir.
Patrón: 7  1   s m  Modelo, xeralmente de papel, a 
partir do que se fan 
elementos semellantes.