Parabéns e grazas! Xosé
2014-06-07 11:55 GMT+02:00 Adrián Chaves Fernández <[email protected]>: > Para que non pareza que o proxecto anda parado, pensei que o mellor sería > facer un resumo tanto do que estiven a facer estes últimos meses como do que > estou a facer agora en relación co corrector de galego. > > Actualización de módulos e solución de erros > ============================================ > > Estou procurando facer tarefas de mantemento do corrector cada certo tempo. > Estas tarefas inclúen: > > • Solucionar erros dos que se informou mediante Github¹. > • Solucionar erros dos que se informou no wiki de Trasno². > • Actualizar os módulos de vocabulario e suxestións susceptíbeis de > requirir actualizacións, ben manualmente (coma no caso das suxestións da > Galipedia) ou ben automaticamente (que por sorte é o caso maioritario). > > Os cambios relacionados con estas tarefas de mantemento que levo feitos dende > o 13 de outubro do ano pasado están listos para integrarse co almacén > principal en calquera momento: > > https://github.com/meixome/hunspell-gl/pull/191 > > Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao > «volga» como módulo principal de vocabulario. O módulo é basicamente o «volga» > con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron > detectando. > > Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o > DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de > correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de > «comunidade», o módulo onde se está a gardar vocabulario que non está apoiado > por fontes que teñan módulo de seu. > > > Limpeza do módulo de comunidade > =============================== > > Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos, > todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo > separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar > vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún > outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un > módulo que as conteña. > > Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no > VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a > existencia da palabra, «autoestima» engadiuse ao módulo «comunidade». > > Ao principio da súa creación, o módulo «comunidade» estaba repleto de > vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así > que decidín poñerme a buscar fontes que contemplasen termos de «comunidade», > creando módulos para esas fontes e eliminando os termos de «comunidade». > > Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica, > e agora contamos cunha chea de módulos novos ou estendidos que poden > actualizarse de maneira automática: ceg (Confederación de Empresarios de > Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e > wiktionary. > > Estes cambios tamén están listos para integrarse co almacén principal en > calquera momento: > > https://github.com/meixome/hunspell-gl/pull/192 > > > Automatización do módulo «drag» > =============================== > > No que estou traballando nestes momentos, dende hai un par de semanas, é en > automatizar a xeración do módulo «drag» a partir do contido das entradas do > dicionario da Real Academia Galega³. > > Supoñendo que o dea conseguido, isto permitiríanos: > > • Incluír no corrector vocabulario que foi engadido ao DRAG pero non > estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias > xa se corrixiron manualmente a medida que se descubriron). > • Detectar cando a RAG engada novas entradas ao dicionario ou > modifique > entradas en aspectos que afecten á ortografía (e.g. a transitividade dos > verbos). > • Poder adaptar facilmente o corrector a calquera cambio no formato ou > calquera nova funcionalidade de Hunspell. > > Estou a usar o contido actual do módulo «drag» como referencia para asegurarme > de que o contido xerado automaticamente non introduce erros ou elimina > vocabulario ou datos de contexto que fornece o contido actual do módulo, e de > momento estou bastante seguro de que conseguirei esta automatización co tempo. > > > Máis nada :) > > > — > ¹ https://github.com/meixome/hunspell-gl/issues > ² > http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes > ³ www.realacademiagalega.org/dicionario > _______________________________________________ > Proxecto mailing list > [email protected] > http://listas.trasno.net/listinfo/proxecto _______________________________________________ Proxecto mailing list [email protected] http://listas.trasno.net/listinfo/proxecto

