Re: [Hunspell] Progreso pola miña banda nos últimos meses

2014-06-07 Conversa Marcos Lans
+1 Bo traballo

En 07/06/14 12:04, Xosé escribiu:
> Parabéns e grazas!
> 
> Xosé
> 
> 2014-06-07 11:55 GMT+02:00 Adrián Chaves Fernández :
>> Para que non pareza que o proxecto anda parado, pensei que o mellor sería
>> facer un resumo tanto do que estiven a facer estes últimos meses como do que
>> estou a facer agora en relación co corrector de galego.
>>
>> Actualización de módulos e solución de erros
>> 
>>
>> Estou procurando facer tarefas de mantemento do corrector cada certo tempo.
>> Estas tarefas inclúen:
>>
>> • Solucionar erros dos que se informou mediante Github¹.
>> • Solucionar erros dos que se informou no wiki de Trasno².
>> • Actualizar os módulos de vocabulario e suxestións susceptíbeis de
>>   requirir actualizacións, ben manualmente (coma no caso das suxestións 
>> da
>>   Galipedia) ou ben automaticamente (que por sorte é o caso maioritario).
>>
>> Os cambios relacionados con estas tarefas de mantemento que levo feitos dende
>> o 13 de outubro do ano pasado están listos para integrarse co almacén
>> principal en calquera momento:
>>
>> https://github.com/meixome/hunspell-gl/pull/191
>>
>> Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao
>> «volga» como módulo principal de vocabulario. O módulo é basicamente o 
>> «volga»
>> con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron
>> detectando.
>>
>> Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o
>> DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de
>> correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de
>> «comunidade», o módulo onde se está a gardar vocabulario que non está apoiado
>> por fontes que teñan módulo de seu.
>>
>>
>> Limpeza do módulo de comunidade
>> ===
>>
>> Desde que efectuamos a separación dos ficheiros fonte do corrector en 
>> módulos,
>> todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo
>> separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar
>> vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún
>> outro módulo, e para as que non se dispón dunha fonte a partir da cal crear 
>> un
>> módulo que as conteña.
>>
>> Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no
>> VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a
>> existencia da palabra, «autoestima» engadiuse ao módulo «comunidade».
>>
>> Ao principio da súa creación, o módulo «comunidade» estaba repleto de
>> vocabulario (especialmente de topónimos) do que era posible atopar fontes. 
>> Así
>> que decidín poñerme a buscar fontes que contemplasen termos de «comunidade»,
>> creando módulos para esas fontes e eliminando os termos de «comunidade».
>>
>> Como resultado o contido do módulo «comunidade» reduciuse de maneira 
>> drástica,
>> e agora contamos cunha chea de módulos novos ou estendidos que poden
>> actualizarse de maneira automática: ceg (Confederación de Empresarios de
>> Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e
>> wiktionary.
>>
>> Estes cambios tamén están listos para integrarse co almacén principal en
>> calquera momento:
>>
>> https://github.com/meixome/hunspell-gl/pull/192
>>
>>
>> Automatización do módulo «drag»
>> ===
>>
>> No que estou traballando nestes momentos, dende hai un par de semanas, é en
>> automatizar a xeración do módulo «drag» a partir do contido das entradas do
>> dicionario da Real Academia Galega³.
>>
>> Supoñendo que o dea conseguido, isto permitiríanos:
>>
>> • Incluír no corrector vocabulario que foi engadido ao DRAG pero non
>>   estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias
>>   xa se corrixiron manualmente a medida que se descubriron).
>> • Detectar cando a RAG engada novas entradas ao dicionario ou 
>> modifique
>>   entradas en aspectos que afecten á ortografía (e.g. a transitividade 
>> dos
>>   verbos).
>> • Poder adaptar facilmente o corrector a calquera cambio no formato ou
>>   calquera nova funcionalidade de Hunspell.
>>
>> Estou a usar o contido actual do módulo «drag» como referencia para 
>> asegurarme
>> de que o contido xerado automaticamente non introduce erros ou elimina
>> vocabulario ou datos de contexto que fornece o contido actual do módulo, e de
>> momento estou bastante seguro de que conseguirei esta automatización co 
>> tempo.
>>
>>
>> Máis nada :)
>>
>>
>> —
>> ¹ https://github.com/meixome/hunspell-gl/issues
>> ²
>> http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes
>> ³ www.realacademiagalega.org/dicionario
>> ___
>> Proxecto mailing list
>> Proxecto@trasno.net
>> http://listas.trasno.net/listinfo/proxecto
> _

Re: [Hunspell] Progreso pola miña banda nos últimos meses

2014-06-07 Conversa Xosé
Parabéns e grazas!

Xosé

2014-06-07 11:55 GMT+02:00 Adrián Chaves Fernández :
> Para que non pareza que o proxecto anda parado, pensei que o mellor sería
> facer un resumo tanto do que estiven a facer estes últimos meses como do que
> estou a facer agora en relación co corrector de galego.
>
> Actualización de módulos e solución de erros
> 
>
> Estou procurando facer tarefas de mantemento do corrector cada certo tempo.
> Estas tarefas inclúen:
>
> • Solucionar erros dos que se informou mediante Github¹.
> • Solucionar erros dos que se informou no wiki de Trasno².
> • Actualizar os módulos de vocabulario e suxestións susceptíbeis de
>   requirir actualizacións, ben manualmente (coma no caso das suxestións da
>   Galipedia) ou ben automaticamente (que por sorte é o caso maioritario).
>
> Os cambios relacionados con estas tarefas de mantemento que levo feitos dende
> o 13 de outubro do ano pasado están listos para integrarse co almacén
> principal en calquera momento:
>
> https://github.com/meixome/hunspell-gl/pull/191
>
> Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao
> «volga» como módulo principal de vocabulario. O módulo é basicamente o «volga»
> con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron
> detectando.
>
> Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o
> DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de
> correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de
> «comunidade», o módulo onde se está a gardar vocabulario que non está apoiado
> por fontes que teñan módulo de seu.
>
>
> Limpeza do módulo de comunidade
> ===
>
> Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos,
> todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo
> separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar
> vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún
> outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un
> módulo que as conteña.
>
> Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no
> VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a
> existencia da palabra, «autoestima» engadiuse ao módulo «comunidade».
>
> Ao principio da súa creación, o módulo «comunidade» estaba repleto de
> vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así
> que decidín poñerme a buscar fontes que contemplasen termos de «comunidade»,
> creando módulos para esas fontes e eliminando os termos de «comunidade».
>
> Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica,
> e agora contamos cunha chea de módulos novos ou estendidos que poden
> actualizarse de maneira automática: ceg (Confederación de Empresarios de
> Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e
> wiktionary.
>
> Estes cambios tamén están listos para integrarse co almacén principal en
> calquera momento:
>
> https://github.com/meixome/hunspell-gl/pull/192
>
>
> Automatización do módulo «drag»
> ===
>
> No que estou traballando nestes momentos, dende hai un par de semanas, é en
> automatizar a xeración do módulo «drag» a partir do contido das entradas do
> dicionario da Real Academia Galega³.
>
> Supoñendo que o dea conseguido, isto permitiríanos:
>
> • Incluír no corrector vocabulario que foi engadido ao DRAG pero non
>   estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias
>   xa se corrixiron manualmente a medida que se descubriron).
> • Detectar cando a RAG engada novas entradas ao dicionario ou 
> modifique
>   entradas en aspectos que afecten á ortografía (e.g. a transitividade dos
>   verbos).
> • Poder adaptar facilmente o corrector a calquera cambio no formato ou
>   calquera nova funcionalidade de Hunspell.
>
> Estou a usar o contido actual do módulo «drag» como referencia para asegurarme
> de que o contido xerado automaticamente non introduce erros ou elimina
> vocabulario ou datos de contexto que fornece o contido actual do módulo, e de
> momento estou bastante seguro de que conseguirei esta automatización co tempo.
>
>
> Máis nada :)
>
>
> —
> ¹ https://github.com/meixome/hunspell-gl/issues
> ²
> http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes
> ³ www.realacademiagalega.org/dicionario
> ___
> Proxecto mailing list
> Proxecto@trasno.net
> http://listas.trasno.net/listinfo/proxecto
___
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto


[Hunspell] Progreso pola miña banda nos últimos meses

2014-06-07 Conversa Adrián Chaves Fernández
Para que non pareza que o proxecto anda parado, pensei que o mellor sería 
facer un resumo tanto do que estiven a facer estes últimos meses como do que 
estou a facer agora en relación co corrector de galego.

Actualización de módulos e solución de erros


Estou procurando facer tarefas de mantemento do corrector cada certo tempo. 
Estas tarefas inclúen:

• Solucionar erros dos que se informou mediante Github¹.
• Solucionar erros dos que se informou no wiki de Trasno².
• Actualizar os módulos de vocabulario e suxestións susceptíbeis de 
  requirir actualizacións, ben manualmente (coma no caso das suxestións da 
  Galipedia) ou ben automaticamente (que por sorte é o caso maioritario).

Os cambios relacionados con estas tarefas de mantemento que levo feitos dende 
o 13 de outubro do ano pasado están listos para integrarse co almacén 
principal en calquera momento:

https://github.com/meixome/hunspell-gl/pull/191

Estes cambios inclúen a creación dun novo módulo, «drag», que substitúe ao 
«volga» como módulo principal de vocabulario. O módulo é basicamente o «volga» 
con modificacións baseadas en diferencias entre o DRAG e o VOLGa que se foron 
detectando.

Os cambios tamén inclúen unha morea de vocabulario que non contemplan nin o 
DRAG nin o VOLGa, vocabulario suxerido en distintas páxinas e na lista de 
correo de Trasno no pasado. Este vocabulario foi engadido ao módulo de 
«comunidade», o módulo onde se está a gardar vocabulario que non está apoiado 
por fontes que teñan módulo de seu.


Limpeza do módulo de comunidade
===

Desde que efectuamos a separación dos ficheiros fonte do corrector en módulos, 
todo o vocabulario do corrector que non procedía do VOLGa meteuse nun módulo 
separado, «comunidade». O obxectivo do módulo «comunidade» é o de albergar 
vocabulario e suxestións suxeridas por usuarios que aínda non están en ningún 
outro módulo, e para as que non se dispón dunha fonte a partir da cal crear un 
módulo que as conteña.

Por exemplo, suxeriuse a palabra «autoestima». Esta palabra non está nin no 
VOLGa nin no DRAG. Ata que se atope outra fonte “oficialista” que contemple a 
existencia da palabra, «autoestima» engadiuse ao módulo «comunidade».

Ao principio da súa creación, o módulo «comunidade» estaba repleto de 
vocabulario (especialmente de topónimos) do que era posible atopar fontes. Así 
que decidín poñerme a buscar fontes que contemplasen termos de «comunidade», 
creando módulos para esas fontes e eliminando os termos de «comunidade».

Como resultado o contido do módulo «comunidade» reduciuse de maneira drástica, 
e agora contamos cunha chea de módulos novos ou estendidos que poden 
actualizarse de maneira automática: ceg (Confederación de Empresarios de 
Galicia), microsoft, santiago (concello), udc, usc, uvigo, wikipedia e 
wiktionary.

Estes cambios tamén están listos para integrarse co almacén principal en 
calquera momento:

https://github.com/meixome/hunspell-gl/pull/192


Automatización do módulo «drag»
===

No que estou traballando nestes momentos, dende hai un par de semanas, é en 
automatizar a xeración do módulo «drag» a partir do contido das entradas do 
dicionario da Real Academia Galega³.

Supoñendo que o dea conseguido, isto permitiríanos:

• Incluír no corrector vocabulario que foi engadido ao DRAG pero non 
  estaba no VOLGa (do que aínda non sabemos, algunhas destas diferencias 
  xa se corrixiron manualmente a medida que se descubriron).
• Detectar cando a RAG engada novas entradas ao dicionario ou modifique 

  entradas en aspectos que afecten á ortografía (e.g. a transitividade dos 
  verbos).
• Poder adaptar facilmente o corrector a calquera cambio no formato ou  

  calquera nova funcionalidade de Hunspell.

Estou a usar o contido actual do módulo «drag» como referencia para asegurarme 
de que o contido xerado automaticamente non introduce erros ou elimina 
vocabulario ou datos de contexto que fornece o contido actual do módulo, e de 
momento estou bastante seguro de que conseguirei esta automatización co tempo.


Máis nada :)


—
¹ https://github.com/meixome/hunspell-gl/issues
² 
http://wiki.trasno.net/Coordinaci%C3%B3n_do_desenvolvemento_do_corrector_Hunspell_de_galego#Erros_e_propostas_pendentes
³ www.realacademiagalega.org/dicionario
___
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto