PhantomJS + Selenium::Remote::Driver http://blogs.perl.org/users/robhammond/2013/02/web-scraping-with-perl-phantomjs.html https://metacpan.org/module/Selenium::Remote::Driver
понедельник, 7 октября 2013 г. пользователь Евгений Заварыкин писал: > Тут отлично подойдет phantomjs ( http://phantomjs.org/ ). На perl можно > сделать обертку под него. > > > 7 октября 2013 г., 8:19 пользователь Dmitry L. > <[email protected]<javascript:_e({}, 'cvml', '[email protected]');> > > написал: > >> +1 к WWW::Mechanize::Firefox. Или какой-нибудь WebDriver. >> >> А искать я бы стал средствами js в самом браузере (и менять DOM как >> вздумается, например как предложил Сергей - обернуть нужный кусок в >> span), а потом просто сделать скриншот. >> >> 2013/10/7 Nikolay Mishin <[email protected] <javascript:_e({}, 'cvml', >> '[email protected]');>>: >> > я бы попробовал >> > use WWW::Mechanize::Firefox; >> > он умеет скриншоты делать >> > >> https://github.com/gitpan/WWW-Mechanize-Firefox/blob/master/eg/screenshot.pl >> > потом >> > use GD; >> > https://metacpan.org/module/GD >> > в общем, думаю, задача вполне решаема, вот только вопрос в >> производительности >> > >> > можете поконкретнее сказать что искать на странице и как это должно >> выглядеть в итоге? >> > 07.10.2013, 00:24, "Dmitry Eremeev" <[email protected]<javascript:_e({}, >> > 'cvml', '[email protected]');> >> >: >> >> Коллеги, здравствуйте! >> >> >> >> Есть такая задача: на входе url некой страницы и сигнатуры (куски >> текста или строки из html-кода). Нужно туда сходить вебкитом, или еще чем, >> срендерить и вернуть png-скриншот шириной 1024px (высота не ограничена). На >> полученной картинке нужно пометить место с найденной сигнатурой (наложить >> картинку с галкой, например). >> >> >> >> Ситуация усложняется тем, что искать нужно не только текст, но и куски >> html-кода и в этом случае помечать на картинке места, в которых примерно >> находится код. То есть, например, если в сигнатуре будет <img src, то нужно >> будет указать на странице-скриншоте место с этой самой картинкой. >> >> >> >> В общем, надо отрендерить страницу как бы в браузере шириной 1024 и >> правильно показать-отметить на ней то, что находится по строчным сигнатурам >> в html-исходнике. >> >> >> >> Это решаемо силами перла? Кто-то может взяться это слабать за разумные >> бабки? Нужно в виде подключаемой либы, что надо из сипана на тачку поставим. >> >> >> >> Перл относительно критичен тем, что данный модуль будет заинтегрирован >> в уже работающий внутренний продукт конторы, а продукту 100 лет и он на >> древнем пятом портяночном перле. >> >> >> >> Yours, >> >> Dmitry Eremeev >> >> +7 906 7005771 >> >> -- >> >> Moscow.pm mailing list >> >> [email protected] <javascript:_e({}, 'cvml', '[email protected]');> | >> http://moscow.pm.org >> > >> > -- >> > С уважением >> > Николай Мишин >> > >> > -- >> > Moscow.pm mailing list >> > [email protected] <javascript:_e({}, 'cvml', '[email protected]');> | >> http://moscow.pm.org >> >> >> >> -- >> //wbr, Dmitry L. >> -- >> Moscow.pm mailing list >> [email protected] <javascript:_e({}, 'cvml', '[email protected]');> | >> http://moscow.pm.org >> > >
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
