2009/10/24, José Manuel Castroagudín Silva <[email protected]>: > 2009/10/24, marce <[email protected]>: >> O Sábado, 24 de Outubro de 2009 17:32:11 José Manuel Castroagudín Silva >> escribiu: >>> cunha GUI, en liña de ordes, proporcionándolle un ficheiro, e tamén a >> >> A versión que le de stdin sería a que habería que probar co msgexec >> >>> polo visto. Acabo de atopar as regras para o galego (son só tres >>> regras? terei que seguir buscando), que parece que no paquete que >>> proporcionan eles non vai incluído. >> >> ????? Non pode ser, eu collín as fontes ..... distribúen eles algún >> paquete? > > http://www.languagetool.org/download/LanguageTool-0.9.9.oxt > > Ese é para OOo "3.0.1 or later". As descargas están na páxina > principal (http://www.languagetool.org/). Teñen outra versión para OOo > 3.0.0. > > Despois descarguei as fontes, e vin que xa se está integrando o galego > (nese paquete non hai rastro del). Así que fixeches ben en ir ás > fontes, vaia. > >> >> >>> Ah, e tamén funciona como unha extensión de OpenOffice (de feito, >> ... de feito é unha das alternativas que se barallan para servir de motor >> de >> serie para a corrección gramatical en Oo.org. >> >>> Pois... mola. Agora terei que reler as crípticas mensaxes que mandou >>> Marce no seu momento (espero que agora me entere de algo, jeje). Así >>> de memoria... había unha onde comentabas que fixeras algo co >>> pology+apertium ? Ben, si, terei que reler todas de novo. >> >> Pois si, pology consiste nunha serie de scripts, todos eles documentados > > Realmente é bastante máis. De serie leva incluídos uns scripts, pero > sería fácil (de feito, case me da gana de facelo) facer un que > comprobe un .po, o pase por huspell, colla os pares de msgid-msgstr > que teñan fallos, os meta nun ficheiro temporal, o abra co editor que > lle digamos, e ao acabar faga un merge co orixinal... Podería ser útil > de carallo...
Parcialmente relacionado: http://code.google.com/p/pyhunspell/wiki/UsingPyHunspell Parece algo limitado (parece que só pode traballar palabra a palabra), pero funcionar funciona (cando non rebenta, claro): jchaves@amilo:~/soft/lingua/pyhunspell$ python Python 2.5.4 (r254:67916, Sep 26 2009, 08:19:36) [GCC 4.3.4] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import hunspell >>> a=hunspell.HunSpell('/usr/share/myspell/dicts/gl_ES.dic', >>> '/usr/share/myspell/dict/gl_ES.aff') >>> a.spell('hola') False >>> a.suggest('hola') ['halo', 'gola', 'ola'] *** glibc detected *** python: free(): invalid next size (fast): 0x089c52c8 *** (...morte...) Aí queda, como nota mental e para quen queira botarlle un ollo > >> (abondo como para aprender a empregalos lendo a documentación), >> -un deles permite facer tradución automática empregando apertium >> (pomtrans) >> -outro permite empregar subscripts: posieve >> --un subscript permite empregar LanguageTools (check-grammar) >> --outro permite corrixir a ortografía a través de enchant, e polo tanto >> de >> hunspell (check-spell-ec) >> --outro permite comprobar que as etiquetas xml estexan correctas >> (check- >> docbook4 e check-xml-kde) >> >> -- e check-rules é como o anel ese que un tal Frodo Bolsón estivo >> durante >> tres anos tentando destruír: permite aplicar todo á vez >> >> --bad-patterns é como unha versión lixeira do anterior. >> >> >>> Aproveito xa de paso para recordar a existencia do programa "msgexec" >>> (man msgexec), que creo que vai dentro das gettext tools, e que >>> permite, por exemplo, facer cousas como: >>> >>> msgexec -i gl.po hunspell -a >> >> A saída non é similar, a de pology está moito máis traballada para ser de >> utilidade para persoas. >> http://mailinglist.lxde.org/pipermail/translation/2009-October/000389.html > > Si, a capacidade de abstracción deste framework (véxase o cacho de > código que vou pegar despois), ven de pm para traballar. O feito de > coller e facer un system( hunspell -a msg.msgstr) (ou equivalente en > python, escribo de memoria e téñoo algo esquecido), e despois coller o > msg completo e pasalo a outro lado, está de PM. > > cat = Catalog("hello.pot", create=True, truncate=True) > msg = Message() > msg.msgid = u"Hello, world!" > cat.add(msg) > cat.sync() > > > Eu o msgexec úsoo para, usando greps, sacar unha lista de palabras > erróneas. Despois, coa lista diante e o poedit aberto, vou revisando > (Control+F, e tal). Pero estas ferramentas poden vir caralludamente... > > Que vos parecería abrir un fío para comezar unha "chuvia de ideas" > sobre cousas que estaría ben facer (por exemplo, o script que dixen > arriba)? Non me comprometo a nada, pero se cadra cando ande menos > liado, podería intentar facer realidade algunha delas... > > -- > Saúde, > > Chaves - http://chav.es > -- Saúde, Chaves - http://chav.es

