Exite um software free, feito em Java, claro :), que faz a indexa��o e pesquisa textual.
 
Parece que eh muito bom e agora est� incorporado ao projeto Jakarta.
 
Chama-se Lucene. Vale a pena conferir !
 
http://jakarta.apache.org/lucene/docs/index.html
 
O grande lance � que n�o existe um parser para a l�ngua portuguesa. O parser, pelo que entendi l�, � aquele peda�o de software que tira os sufixos das palavras, pois quando vc pesquisar, por exemplo, pelas palavras "sapo", "sap�o" ou "sapinho", qualquer texto que tiver a palavra "sapo" deve retornar na pesquisa.
 
Eu at� comecei a fazer uma parser para portugu�s, usando o algoritmo "Portter Steamer"( acho q o nome eh esse), mas parei por falta de tempo.
 
Pesquisa l� ...
 

Kleber Rodrigo de Carvalho <[EMAIL PROTECTED]> wrote:
PessoALL
 
Vou ter que desenvolver um sistema de busca em Java.
Esse sistema ter� que ter um funcionamento parecido com o google, mas ele vai fazer  pesquisa em uma raiz de diretorio de um computador local. A busca ser� feita em arquivos html ou txt.
 
Pesquisei no google, e no arquivo da lista da soujava (java-list e enterprise-list) mas n�o encontrei nada a respeito.
 
Algu�m terei alguma informa��o para me ajuda ?
 
Obrigado
Kleber Rodrigo de Carvalho
 
 



Yahoo! Mail
Mais espa�o, mais seguran�a e gratuito: caixa postal de 6MB, antiv�rus, prote��o contra spam.

Responder a