Para que non pareza que o proxecto anda parado, pensei que o mellor sería
facer un resumo tanto do que estiven a facer estes últimos meses como do que
estou a facer agora en relación co corrector de galego.
Actualización de módulos e solución de erros
============================================
Estou procurando facer tarefas de mantemento do corrector cada certo tempo.
Estas tarefas inclúen:
• Solucionar erros dos que se informou mediante Github¹.
• Solucionar erros dos que se informou no wiki de Trasno².
• Actualizar os módulos de vocabulario e suxestións susceptíbeis de
requirir actualizacións, ben manualmente (coma no caso das suxestións da
Galipedia) ou ben automaticamente (que por sorte é o caso maioritario).
Os cambios relacionados con estas tarefas de mantemento que levo feitos dende
o 13 de outubro do ano pasado están listos para integrarse co almacén
principal en calquera momento:
https://github.com/meixome/hunspell-gl/pull/191
Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao
«volga» como módulo principal de vocabulario. O módulo é basicamente o «volga»
con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron
detectando.
Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o
DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de
correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de
«comunidade», o módulo onde se está a gardar vocabulario que non está apoiado
por fontes que teñan módulo de seu.
Limpeza do módulo de comunidade
===============================
Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos,
todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo
separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar
vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún
outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un
módulo que as conteña.
Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no
VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a
existencia da palabra, «autoestima» engadiuse ao módulo «comunidade».
Ao principio da súa creación, o módulo «comunidade» estaba repleto de
vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así
que decidín poñerme a buscar fontes que contemplasen termos de «comunidade»,
creando módulos para esas fontes e eliminando os termos de «comunidade».
Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica,
e agora contamos cunha chea de módulos novos ou estendidos que poden
actualizarse de maneira automática: ceg (Confederación de Empresarios de
Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e
wiktionary.
Estes cambios tamén están listos para integrarse co almacén principal en
calquera momento:
https://github.com/meixome/hunspell-gl/pull/192
Automatización do módulo «drag»
===============================
No que estou traballando nestes momentos, dende hai un par de semanas, é en
automatizar a xeración do módulo «drag» a partir do contido das entradas do
dicionario da Real Academia Galega³.
Supoñendo que o dea conseguido, isto permitiríanos:
• Incluír no corrector vocabulario que foi engadido ao DRAG pero non
estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias
xa se corrixiron manualmente a medida que se descubriron).
• Detectar cando a RAG engada novas entradas ao dicionario ou modifique
entradas en aspectos que afecten á ortografía (e.g. a transitividade dos
verbos).
• Poder adaptar facilmente o corrector a calquera cambio no formato ou
calquera nova funcionalidade de Hunspell.
Estou a usar o contido actual do módulo «drag» como referencia para asegurarme
de que o contido xerado automaticamente non introduce erros ou elimina
vocabulario ou datos de contexto que fornece o contido actual do módulo, e de
momento estou bastante seguro de que conseguirei esta automatización co tempo.
Máis nada :)
—
¹ https://github.com/meixome/hunspell-gl/issues
²
http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes
³ www.realacademiagalega.org/dicionario
_______________________________________________
Proxecto mailing list
[email protected]
http://listas.trasno.net/listinfo/proxecto