2009/10/24, José Manuel Castroagudín Silva <chavescesu...@gmail.com>:
> 2009/10/24, marce <mvillar...@gmail.com>:
>> O Sábado, 24 de Outubro de 2009 17:32:11 José Manuel Castroagudín Silva
>> escribiu:
>>> cunha GUI, en liña de ordes, proporcionándolle un ficheiro, e tamén a
>>
>> A versión que le de stdin sería a que habería que probar co msgexec
>>
>>> polo visto. Acabo de atopar as regras para o galego (son só tres
>>> regras? terei que seguir buscando), que parece que no paquete que
>>> proporcionan eles non vai incluído.
>>
>> ????? Non pode ser, eu collín as fontes ..... distribúen eles algún
>> paquete?
>
> http://www.languagetool.org/download/LanguageTool-0.9.9.oxt
>
> Ese é para OOo "3.0.1 or later". As descargas están na páxina
> principal (http://www.languagetool.org/). Teñen outra versión para OOo
> 3.0.0.
>
> Despois descarguei as fontes, e vin que xa se está integrando o galego
> (nese paquete non hai rastro del). Así que fixeches ben en ir ás
> fontes, vaia.
>
>>
>>
>>> Ah, e tamén funciona como unha extensión de OpenOffice (de feito,
>> ... de feito é unha das alternativas que se barallan para servir de motor
>> de
>> serie para a corrección gramatical en Oo.org.
>>
>>> Pois... mola. Agora terei que reler as crípticas mensaxes que mandou
>>> Marce no seu momento (espero que agora me entere de algo, jeje). Así
>>> de memoria... había unha onde comentabas que fixeras algo co
>>> pology+apertium ? Ben, si, terei que reler todas de novo.
>>
>> Pois si, pology consiste nunha serie de scripts, todos eles documentados
>
> Realmente é bastante máis. De serie leva incluídos uns scripts, pero
> sería fácil (de feito, case me da gana de facelo) facer un que
> comprobe un .po, o pase por huspell, colla os pares de msgid-msgstr
> que teñan fallos, os meta nun ficheiro temporal, o abra co editor que
> lle digamos, e ao acabar faga un merge co orixinal... Podería ser útil
> de carallo...


Parcialmente relacionado:

http://code.google.com/p/pyhunspell/wiki/UsingPyHunspell

Parece algo limitado (parece que só pode traballar palabra a palabra),
pero funcionar funciona (cando non rebenta, claro):

jchaves@amilo:~/soft/lingua/pyhunspell$ python
Python 2.5.4 (r254:67916, Sep 26 2009, 08:19:36)
[GCC 4.3.4] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import hunspell
>>> a=hunspell.HunSpell('/usr/share/myspell/dicts/gl_ES.dic', 
>>> '/usr/share/myspell/dict/gl_ES.aff')
>>> a.spell('hola')
False
>>> a.suggest('hola')
['halo', 'gola', 'ola']
*** glibc detected *** python: free(): invalid next size (fast): 0x089c52c8 ***

(...morte...)


Aí queda, como nota mental e para quen queira botarlle un ollo

>
>> (abondo como para aprender a empregalos lendo a documentación),
>> -un deles permite facer tradución automática empregando apertium
>> (pomtrans)
>> -outro permite empregar subscripts: posieve
>>   --un subscript permite empregar LanguageTools (check-grammar)
>>   --outro permite corrixir a ortografía a través de enchant, e polo tanto
>> de
>> hunspell (check-spell-ec)
>>   --outro permite comprobar que as etiquetas xml estexan correctas
>> (check-
>> docbook4 e check-xml-kde)
>>
>>  -- e check-rules é como o anel ese que  un tal Frodo Bolsón estivo
>> durante
>> tres anos tentando destruír: permite aplicar todo á vez
>>
>>   --bad-patterns é como unha versión lixeira do anterior.
>>
>>
>>> Aproveito xa de paso para recordar a existencia do programa "msgexec"
>>> (man msgexec), que creo que vai dentro das gettext tools, e que
>>> permite, por exemplo, facer cousas como:
>>>
>>> msgexec -i gl.po hunspell -a
>>
>> A saída non é similar, a de pology está moito máis traballada para ser de
>> utilidade para persoas.
>> http://mailinglist.lxde.org/pipermail/translation/2009-October/000389.html
>
> Si, a capacidade de abstracción deste framework (véxase o cacho de
> código que vou pegar despois), ven de pm para traballar. O feito de
> coller e facer un system( hunspell -a msg.msgstr) (ou equivalente en
> python, escribo de memoria e téñoo algo esquecido), e despois coller o
> msg completo e pasalo a outro lado, está de PM.
>
> cat = Catalog("hello.pot", create=True, truncate=True)
> msg = Message()
> msg.msgid = u"Hello, world!"
> cat.add(msg)
> cat.sync()
>
>
> Eu o msgexec úsoo para, usando greps, sacar unha lista de palabras
> erróneas. Despois, coa lista diante e o poedit aberto, vou revisando
> (Control+F, e tal). Pero estas ferramentas poden vir caralludamente...
>
> Que vos parecería abrir un fío para comezar unha "chuvia de ideas"
> sobre cousas que estaría ben facer (por exemplo, o script que dixen
> arriba)? Non me comprometo a nada, pero se cadra cando ande menos
> liado, podería intentar facer realidade algunha delas...
>
> --
> Saúde,
>
> Chaves - http://chav.es
>


-- 
Saúde,

Chaves - http://chav.es

Responderlle a