O Domingo, 18 de Outubro de 2009 13:54:11 Leandro Regueiro escribiu:
> > Anímase alguén a converter as regras do Golfiño en regras do
> > LanguageTool?

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Versión moi preliminar
# Licenza BSD como aparece en http://www.opensource.org/licenses/bsd-
license.php
# con 
#<OWNER> = A.C. Proxecto Trasno
# <ORGANIZATION> = A.C. Proxecto Trasno
# <YEAR> = 2009

def procesaPadronErro(cadea):
  #a chave das noces
  if cadea.count("+") == 0:
     for palabra in cadea.split(" "):
       print "    <token>"+palabra+"</token>"
  else:
     for palabra in cadea.split("+"):
       print "    <token>"+palabra+"</token>"


print """<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE rules SYSTEM "../rules.dtd">
<?xml-stylesheet type="text/xsl" href="../print.xsl" title="Pretty print" ?>
<?xml-stylesheet type="text/css" href="../rules.css" title="Easy editing 
stylesheet" ?>
<rules lang="gl">"""
print "<category name=\"exemplo\">"
acumulador = []
for linha in open("erroutf.txt"):
  contido = linha.split("|")[0:5]
  if contido[0].upper() not in acumulador:
        acumulador.append(contido[0].upper())
        print "<rule id=\""+contido[0]+"\" name=\""+contido[1]+"\">"
        print "  <pattern>"
        procesaPadronErro(contido[0])
        print "  </pattern>"
        print "  <message>"+contido[4]+"</message>"
        print "  <example type=\"correct\">"+contido[3]+"</example>"
        print "  <example type=\"incorrect\">"+contido[1]+"</example>"
        print "</rule>"
        print
print "</category>"
print "</rules>"

Falla en procesaPadronErro, que na forma actual é moi sinxelo e en 
consecuencia non cacha máis que coincidencias exactas, sen flexión ningunha

> Nun momento dado habería que facer algo de documentación sobre como
> usar o pology e todo iso, mellor que documentación unha especie de
> xornadas ou cursos. A min interésame moito isto pero non sei por onde
> collelo.

<g><g><g> rtfm <g><g><g>

Pology, nas cousas básicas, funciona moi ben: estatísticas, comproba as 
etiquetas, permite empregar o Apertium, facer comprobacións subtís (... case 
todo o que lle pidas, se creas uns ficheiros de configuración, claro). Está 
escrito integramente en python, e está a disposición do público en... kde, 
claro, que por algo son un celote, e xa lle fixen publicidade outras veces.

Integralo nas CAT? Nicolás fixo case o contrario, integrar lokalize en pology 
:-), por acabar axiña, claro.

> Non estaría mal que todo isto viñera integrado en varias das
> ferramentas que usamos sen ter que facelo nós a man.
LanguageTool é nacido para estar integrado no OO.org, as demais utilidades son 
como cuchipandadas.

Responderlle a