PhantomJS + Selenium::Remote::Driver

http://blogs.perl.org/users/robhammond/2013/02/web-scraping-with-perl-phantomjs.html
https://metacpan.org/module/Selenium::Remote::Driver

понедельник, 7 октября 2013 г. пользователь Евгений Заварыкин писал:

> Тут отлично подойдет phantomjs ( http://phantomjs.org/ ). На perl можно
> сделать обертку под него.
>
>
> 7 октября 2013 г., 8:19 пользователь Dmitry L. 
> <[email protected]<javascript:_e({}, 'cvml', '[email protected]');>
> > написал:
>
>> +1 к WWW::Mechanize::Firefox. Или какой-нибудь WebDriver.
>>
>> А искать я бы стал средствами js в самом браузере (и менять DOM как
>> вздумается, например как предложил Сергей - обернуть нужный кусок в
>> span), а потом просто сделать скриншот.
>>
>> 2013/10/7 Nikolay Mishin <[email protected] <javascript:_e({}, 'cvml',
>> '[email protected]');>>:
>> > я бы попробовал
>> > use WWW::Mechanize::Firefox;
>> > он умеет скриншоты делать
>> >
>> https://github.com/gitpan/WWW-Mechanize-Firefox/blob/master/eg/screenshot.pl
>> > потом
>> > use GD;
>> > https://metacpan.org/module/GD
>> > в общем, думаю, задача вполне решаема, вот только вопрос в
>> производительности
>> >
>> > можете поконкретнее сказать что искать на странице и как это должно
>> выглядеть в итоге?
>> > 07.10.2013, 00:24, "Dmitry Eremeev" <[email protected]<javascript:_e({}, 
>> > 'cvml', '[email protected]');>
>> >:
>> >> Коллеги, здравствуйте!
>> >>
>> >> Есть такая задача: на входе url некой страницы и сигнатуры (куски
>> текста или строки из html-кода). Нужно туда сходить вебкитом, или еще чем,
>> срендерить и вернуть png-скриншот шириной 1024px (высота не ограничена). На
>> полученной картинке нужно пометить место с найденной сигнатурой (наложить
>> картинку с галкой, например).
>> >>
>> >> Ситуация усложняется тем, что искать нужно не только текст, но и куски
>> html-кода и в этом случае помечать на картинке места, в которых примерно
>> находится код. То есть, например, если в сигнатуре будет <img src, то нужно
>> будет указать на странице-скриншоте место с этой самой картинкой.
>> >>
>> >> В общем, надо отрендерить страницу как бы в браузере шириной 1024 и
>> правильно показать-отметить на ней то, что находится по строчным сигнатурам
>> в html-исходнике.
>> >>
>> >> Это решаемо силами перла? Кто-то может взяться это слабать за разумные
>> бабки? Нужно в виде подключаемой либы, что надо из сипана на тачку поставим.
>> >>
>> >> Перл относительно критичен тем, что данный модуль будет заинтегрирован
>> в уже работающий внутренний продукт конторы, а продукту 100 лет и он на
>> древнем пятом портяночном перле.
>> >>
>> >> Yours,
>> >> Dmitry Eremeev
>> >> +7 906 7005771
>> >> --
>> >> Moscow.pm mailing list
>> >> [email protected] <javascript:_e({}, 'cvml', '[email protected]');> |
>> http://moscow.pm.org
>> >
>> > --
>> > С уважением
>> > Николай Мишин
>> >
>> > --
>> > Moscow.pm mailing list
>> > [email protected] <javascript:_e({}, 'cvml', '[email protected]');> |
>> http://moscow.pm.org
>>
>>
>>
>> --
>> //wbr, Dmitry L.
>> --
>> Moscow.pm mailing list
>> [email protected] <javascript:_e({}, 'cvml', '[email protected]');> |
>> http://moscow.pm.org
>>
>
>
-- 
Moscow.pm mailing list
[email protected] | http://moscow.pm.org

Ответить