Sendo um pouco pedante: *web crawler* ou *spider* explora a web em profundidade e tenta recuperar o máximo de informações (exemplo de uso: Google); BuscaPé/JáCotei/afins empregam *scrapers* que exploram sites específicos na horizontal e só consideram os dados que seguem um schema bem-definido. Acho importante fazer essa distinção :)
ABS() 2012/1/13 Nelson Ferraz <[email protected]> > Do site: > > > RESUMO: Como automatizar a navegação web com scripts Perl. Capturar, > tratar e apresentar > > informações capturadas na web com Perl. O conteúdo será ministrado por > uma > > explicação teórica seguida de exercícios/prática. > > Poderia incluir alguma informação prática sobre o que são web > crawlers. Algo como: > > Web crawlers, também conhecidos como "spiders" ou "bots", são > programas criados para navegar na web automaticamente, coletando > informações. Este tipo de programa é frequentemente usado em > ferramentas de busca (como o Google), sites de comparação de preços > (como o Buscapé, KuantoKusta, e JáCotei), ou qualquer outro sistema > que precise coletar informações da web. > =begin disclaimer > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ > SaoPaulo-pm mailing list: [email protected] > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > =end disclaimer >
=begin disclaimer Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm mailing list: [email protected] L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> =end disclaimer
