O Domingo, 18 de Outubro de 2009 13:54:11 Leandro Regueiro escribiu: > > Anímase alguén a converter as regras do Golfiño en regras do > > LanguageTool?
#!/usr/bin/env python # -*- coding: utf-8 -*- # Versión moi preliminar # Licenza BSD como aparece en http://www.opensource.org/licenses/bsd- license.php # con #<OWNER> = A.C. Proxecto Trasno # <ORGANIZATION> = A.C. Proxecto Trasno # <YEAR> = 2009 def procesaPadronErro(cadea): #a chave das noces if cadea.count("+") == 0: for palabra in cadea.split(" "): print " <token>"+palabra+"</token>" else: for palabra in cadea.split("+"): print " <token>"+palabra+"</token>" print """<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE rules SYSTEM "../rules.dtd"> <?xml-stylesheet type="text/xsl" href="../print.xsl" title="Pretty print" ?> <?xml-stylesheet type="text/css" href="../rules.css" title="Easy editing stylesheet" ?> <rules lang="gl">""" print "<category name=\"exemplo\">" acumulador = [] for linha in open("erroutf.txt"): contido = linha.split("|")[0:5] if contido[0].upper() not in acumulador: acumulador.append(contido[0].upper()) print "<rule id=\""+contido[0]+"\" name=\""+contido[1]+"\">" print " <pattern>" procesaPadronErro(contido[0]) print " </pattern>" print " <message>"+contido[4]+"</message>" print " <example type=\"correct\">"+contido[3]+"</example>" print " <example type=\"incorrect\">"+contido[1]+"</example>" print "</rule>" print print "</category>" print "</rules>" Falla en procesaPadronErro, que na forma actual é moi sinxelo e en consecuencia non cacha máis que coincidencias exactas, sen flexión ningunha > Nun momento dado habería que facer algo de documentación sobre como > usar o pology e todo iso, mellor que documentación unha especie de > xornadas ou cursos. A min interésame moito isto pero non sei por onde > collelo. <g><g><g> rtfm <g><g><g> Pology, nas cousas básicas, funciona moi ben: estatísticas, comproba as etiquetas, permite empregar o Apertium, facer comprobacións subtís (... case todo o que lle pidas, se creas uns ficheiros de configuración, claro). Está escrito integramente en python, e está a disposición do público en... kde, claro, que por algo son un celote, e xa lle fixen publicidade outras veces. Integralo nas CAT? Nicolás fixo case o contrario, integrar lokalize en pology :-), por acabar axiña, claro. > Non estaría mal que todo isto viñera integrado en varias das > ferramentas que usamos sen ter que facelo nós a man. LanguageTool é nacido para estar integrado no OO.org, as demais utilidades son como cuchipandadas.

