Para que non pareza que o proxecto anda parado, pensei que o mellor sería facer un resumo tanto do que estiven a facer estes últimos meses como do que estou a facer agora en relación co corrector de galego.
Actualización de módulos e solución de erros ============================================ Estou procurando facer tarefas de mantemento do corrector cada certo tempo. Estas tarefas inclúen: • Solucionar erros dos que se informou mediante Github¹. • Solucionar erros dos que se informou no wiki de Trasno². • Actualizar os módulos de vocabulario e suxestións susceptíbeis de requirir actualizacións, ben manualmente (coma no caso das suxestións da Galipedia) ou ben automaticamente (que por sorte é o caso maioritario). Os cambios relacionados con estas tarefas de mantemento que levo feitos dende o 13 de outubro do ano pasado están listos para integrarse co almacén principal en calquera momento: https://github.com/meixome/hunspell-gl/pull/191 Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao «volga» como módulo principal de vocabulario. O módulo é basicamente o «volga» con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron detectando. Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de «comunidade», o módulo onde se está a gardar vocabulario que non está apoiado por fontes que teñan módulo de seu. Limpeza do módulo de comunidade =============================== Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos, todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un módulo que as conteña. Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a existencia da palabra, «autoestima» engadiuse ao módulo «comunidade». Ao principio da súa creación, o módulo «comunidade» estaba repleto de vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así que decidín poñerme a buscar fontes que contemplasen termos de «comunidade», creando módulos para esas fontes e eliminando os termos de «comunidade». Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica, e agora contamos cunha chea de módulos novos ou estendidos que poden actualizarse de maneira automática: ceg (Confederación de Empresarios de Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e wiktionary. Estes cambios tamén están listos para integrarse co almacén principal en calquera momento: https://github.com/meixome/hunspell-gl/pull/192 Automatización do módulo «drag» =============================== No que estou traballando nestes momentos, dende hai un par de semanas, é en automatizar a xeración do módulo «drag» a partir do contido das entradas do dicionario da Real Academia Galega³. Supoñendo que o dea conseguido, isto permitiríanos: • Incluír no corrector vocabulario que foi engadido ao DRAG pero non estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias xa se corrixiron manualmente a medida que se descubriron). • Detectar cando a RAG engada novas entradas ao dicionario ou modifique entradas en aspectos que afecten á ortografía (e.g. a transitividade dos verbos). • Poder adaptar facilmente o corrector a calquera cambio no formato ou calquera nova funcionalidade de Hunspell. Estou a usar o contido actual do módulo «drag» como referencia para asegurarme de que o contido xerado automaticamente non introduce erros ou elimina vocabulario ou datos de contexto que fornece o contido actual do módulo, e de momento estou bastante seguro de que conseguirei esta automatización co tempo. Máis nada :) — ¹ https://github.com/meixome/hunspell-gl/issues ² http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes ³ www.realacademiagalega.org/dicionario _______________________________________________ Proxecto mailing list Proxecto@trasno.net http://listas.trasno.net/listinfo/proxecto