Para que non pareza que o proxecto anda parado, pensei que o mellor sería 
facer un resumo tanto do que estiven a facer estes últimos meses como do que 
estou a facer agora en relación co corrector de galego.

Actualización de módulos e solución de erros
============================================

Estou procurando facer tarefas de mantemento do corrector cada certo tempo. 
Estas tarefas inclúen:

  • Solucionar erros dos que se informou mediante Github¹.
  • Solucionar erros dos que se informou no wiki de Trasno².
  • Actualizar os módulos de vocabulario e suxestións susceptíbeis de 
   requirir actualizacións, ben manualmente (coma no caso das suxestións da 
   Galipedia) ou ben automaticamente (que por sorte é o caso maioritario).

Os cambios relacionados con estas tarefas de mantemento que levo feitos dende 
o 13 de outubro do ano pasado están listos para integrarse co almacén 
principal en calquera momento:

  https://github.com/meixome/hunspell-gl/pull/191

Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao 
«volga» como módulo principal de vocabulario. O módulo é basicamente o «volga» 
con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron 
detectando.

Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o 
DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de 
correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de 
«comunidade», o módulo onde se está a gardar vocabulario que non está apoiado 
por fontes que teñan módulo de seu.


Limpeza do módulo de comunidade
===============================

Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos, 
todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo 
separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar 
vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún 
outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un 
módulo que as conteña.

Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no 
VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a 
existencia da palabra, «autoestima» engadiuse ao módulo «comunidade».

Ao principio da súa creación, o módulo «comunidade» estaba repleto de 
vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así 
que decidín poñerme a buscar fontes que contemplasen termos de «comunidade», 
creando módulos para esas fontes e eliminando os termos de «comunidade».

Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica, 
e agora contamos cunha chea de módulos novos ou estendidos que poden 
actualizarse de maneira automática: ceg (Confederación de Empresarios de 
Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e 
wiktionary.

Estes cambios tamén están listos para integrarse co almacén principal en 
calquera momento:

    https://github.com/meixome/hunspell-gl/pull/192


Automatización do módulo «drag»
===============================

No que estou traballando nestes momentos, dende hai un par de semanas, é en 
automatizar a xeración do módulo «drag» a partir do contido das entradas do 
dicionario da Real Academia Galega³.

Supoñendo que o dea conseguido, isto permitiríanos:

  • Incluír no corrector vocabulario que foi engadido ao DRAG pero non 
   estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias 
   xa se corrixiron manualmente a medida que se descubriron).
    • Detectar cando a RAG engada novas entradas ao dicionario ou modifique 
  
   entradas en aspectos que afecten á ortografía (e.g. a transitividade dos 
   verbos).
  • Poder adaptar facilmente o corrector a calquera cambio no formato ou   
    
   calquera nova funcionalidade de Hunspell.

Estou a usar o contido actual do módulo «drag» como referencia para asegurarme 
de que o contido xerado automaticamente non introduce erros ou elimina 
vocabulario ou datos de contexto que fornece o contido actual do módulo, e de 
momento estou bastante seguro de que conseguirei esta automatización co tempo.


Máis nada :)


—
¹ https://github.com/meixome/hunspell-gl/issues
² 
http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes
³ www.realacademiagalega.org/dicionario
_______________________________________________
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto

Responderlle a