Oi,

2011/4/2 Paulo de Souza Lima <paulo.s.l...@gmail.com>

> Em 2 de abril de 2011 12:56, David Emmerich Jourdain <
> jourd...@documentfoundation.org> escreveu:
>
> > Oi Paulo.
> >
>
> Oi David.
>
> Esqueci de clicar em "Responder para todos" e a msg foi só pra vc e vc
> respondeu só pra mim. Desculpe por isso. Estou copiando a lista, ok?
>
>
> >
> >  Nesse caso, o CoGroo e outras extensões terão de se adaptar, ou
> ficaremos
> >> sem elas. É isso?
> >>
> >
> > Sim, Paulo. Infelizmente.
> >
> > Contudo, o William já manifestou que, se tivermos pessoas que se
> disponham
> > a conduzir o trabalho em Python, ele colabora com alguma consultoria, ou
> > algo assim.
> >
> > Eu compreendo a condição do William. De certa forma, ele pode se sentir
> > como tendo que "refazer a roda". Por isso, se alguém se dispor a
> colaborar
> > com ele, para portar o CoGroo para Python, creio que seria uma boa
> solução.
> >
>
> Eu também compreendo a posição dele. A coisa envolve mais do que o
> LibreOffice. Temos de colocar outras comunidades (leia-se python e outras)
> nas discussões.
>

Eu não me importo em refazer a roda rs. O CoGrOO já foi refeito umas 2
vezes, e estou começando a 3. Será fruto de 2 anos de pesquisas e
experimentos. Espero espero acabar em uns 3 meses, e terão o melhor CoGrOO
de todos os tempos :)

Mas gosto de fazer as coisas na direção certa. Uma coisa é refazer para
melhorar a arquitetura, velocidade, desempenho. Até empolga.

O CoGrOO é grande, e depende fortemente de uma biblioteca chamada Apache
OpenNLP, para a qual eu também contribuo. O problema não é nem reescrever o
CoGrOO, mas reescrever o Apache OpenNLP.

No Python existem alternativas ao Apache OpenNLP, por exemplo o NLTK, mas os
próprios desenvolvedores afirmam que não oferece boa performance, é mais
para uso didático. Já o OpenNLP é usado por centenas de outros projetos,
super bem testado e de alta performance.


>
> >
> > Contudo, talvez seja o momento de unirmos trabalhos com outro projeto. O
> > LanguageTool faz o mesmo serviço que o CoGroo, só que para outros
> idiomas,
> > não para o português. O Marcin, mantenedor principal do projeto, já tem
> uma
> > linha "paralela", que de pouco em pouco, vai ter um outro LanguageTool em
> > Python.
> >
> > Eu já estou auxiliando o Marcin com alguns patch's em python para este
> novo
> > LanguageTool, para portar parte do trabalho feito em Galego, para o
> > português, já que o Galego é o idioma mais próximo do português, e que já
> > está suportado na versão feita em Java.
> >
> > Talvez, para plugins que atendam demandas comuns a diversas culturas,
> como
> > correção gramatical, o caminho para manutenção voluntária seja
> > transformá-los em multi-lingual.
> >
>
> Nessa eu nem vou dar opinião. Não sou programador e não tenho a menor ideia
> do que isso implica, se é possível aproveitar a tecnologia do CoGroo pra
> isso, ou se é preferível portar o CoGroo pra Python. Enfim, sou zero à
> esquerda no assunto. =D
>

Quando o CoGrOO nasceu, também estava por aí o Language Tool, e trocamos
muitas figurinhas. Inclusive o CoGrOO foi o primeiro corretor gramatical
livre a ser integrado ao OO, o LT veio logo depois :)

O problema do Language Tool é justamente ser multi-lingual e bem simples, e
por isso não é bom em nenhuma língua.
Assim como o CoGrOO, o Language Tool faz processamento e análise do texto. O
processamento do LT é bem superficial, e *não* funciona para português,
assim como para a maioria das línguas.
O CoGrOO segue o modelo de análise semi-profunda, que é capaz de identificar
estruturas da língua como sintagmas, sujeito, objeto.

No LT é impossível escrever uma regra como
http://ccsl.ime.usp.br/cogroo/comunidade/rule/124 e como muitas outras do
CoGrOO.

Abraços

-- 
Unsubscribe instructions: E-mail to usuarios+h...@pt-br.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/pt-br/usuarios/
All messages sent to this list will be publicly archived and cannot be deleted

Responder a