Не модуль, но все же: http://eax.me/web-spider/ + см 10-й пункт http://eax.me/mini-notes-issue-4/
2 июня 2012 г., 14:56 пользователь Александр Фокскул <[email protected]>написал: > Я бы посоветовал сразу силениум. На новые версии браузера часто проблемно > найти расширение. > У силениума есть сервер и модуль для перла на CPAN. > > 02.06.2012 14:09 пользователь "Ali Ramazanov" <[email protected]> > написал: > > > > > Как вариант использовать > > https://metacpan.org/module/WWW::Mechanize::Firefox и собственно сам > > firefox с плагином Mozrepl. Решение рабочее, но не производительное. > > Firefox нужно периодически рестартить, из-за отжирания памяти) > > > > 2 июня 2012 г., 9:52 пользователь Alessandro Gorohovski > > <[email protected]> написал: > > > Гнатына Александр <[email protected]> писал(а) в своём письме Fri, 01 Jun > 2012 > > > 23:03:05 +0300: > > > > > >> wget > > >> > > >> Огласите требования. > > > > > > > > > Требования, вроде бы, не хитрые --- нужно сохранить всю инфу > web-страницы в > > > html -файл. > > > > > > Обычно, поступал так, например: > > > > > > my $url = 'http://www.адрес <http://www.xn--80aid7bg>'; > > > > > > > > > my $agent = LWP::UserAgent->new; > > > $agent->agent("Opera"); > > > > > > my $request = HTTP::Request->new( GET => $url ); > > > $request->header('Accept' => 'text/html'); > > > > > > open(FILE, ">info.html"); > > > print FILE_S $response->content; > > > close FILE; > > > > > > Но сейчас столкнулся с тем, что для Web-страниц, содержащих JavaScript > > > все содержимое не могу получить, > > > т.е. то что вижу в броузере (Opera or others) нет в сохранённом файле. > > > > > > Понимаю, что здесь проблема для меня с отработкой JavaScript, которые > > > выполняются в броузере. > > > > > > Вопрос в том, есть ли какой Perl-модуль или что-то консольное, > выполняющее > > > все что делает броузер > > > с возможностью сохранения этого результата? > > > > > > > > > > > >> В Птн, 01/06/2012 в 21:58 +0300, Alessandro Gorohovski пишет: > > >>> > > >>> Уважаемое сообщество, > > >>> Доброго времени суток! > > >>> > > >>> Посоветуйте модуль (кому реально приходилось пользоваться) > > >>> хорошего Web-spider. > > >>> > > >>> P.s. > > >>> На CPAN смотрел, их бескрайнее множество. > > >>> > > >>> Спасибо > > >> > > >> > > >> > > > > > > > > > -- > > > Alessandro > > > > > > -- > > > Moscow.pm mailing list > > > [email protected] | http://moscow.pm.org > > -- > > Moscow.pm mailing list > > [email protected] | http://moscow.pm.org > > -- > Moscow.pm mailing list > [email protected] | http://moscow.pm.org > > -- С уважением, Александр Личный блог: http://eax.me/ Мой форум: http://it-talk.org/ Мой Twitter: http://twitter.com/afiskon
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
