Exite um software free, feito em Java, claro :), que faz a indexa��o e pesquisa textual.
Parece que eh muito bom e agora est� incorporado ao projeto Jakarta.
Chama-se Lucene. Vale a pena conferir !
O grande lance � que n�o existe um parser para a l�ngua portuguesa. O parser, pelo que entendi l�, � aquele peda�o de software que tira os sufixos das palavras, pois quando vc pesquisar, por exemplo, pelas palavras "sapo", "sap�o" ou "sapinho", qualquer texto que tiver a palavra "sapo" deve retornar na pesquisa.
Eu at� comecei a fazer uma parser para portugu�s, usando o algoritmo "Portter Steamer"( acho q o nome eh esse), mas parei por falta de tempo.
Pesquisa l� ...
Kleber Rodrigo de Carvalho <[EMAIL PROTECTED]> wrote:
PessoALLVou ter que desenvolver um sistema de busca em Java.Esse sistema ter� que ter um funcionamento parecido com o google, mas ele vai fazer pesquisa em uma raiz de diretorio de um computador local. A busca ser� feita em arquivos html ou txt.Pesquisei no google, e no arquivo da lista da soujava (java-list e enterprise-list) mas n�o encontrei nada a respeito.Algu�m terei alguma informa��o para me ajuda ?ObrigadoKleber Rodrigo de Carvalho
Yahoo! Mail
Mais espa�o, mais seguran�a e gratuito: caixa postal de 6MB, antiv�rus, prote��o contra spam.
