On 09.11.2011 13:36, Foxcool wrote:
Заранее извиняюсь, возможно, за тривиальные вопросы, т.к. я из редкого
нынче вида Перл-джуниоров.
Есть интересный модуль Web::Scraper, документацию которого я не нахожу
избыточной, т.к. не могу разобраться, как его "натравливать" на теги.
Есть некая страница, которая полна таблиц, идущих друг за другом, разных
и т.д. Первая проблема, с которой я столкнулся: мне нужны определенные
таблицы. И не с определенным id или class, а с значением другого атрибута.

<tablewidth="100%"cellspacing="0"cellpadding="3"border="0">
<tablewidth="100%"cellspacing="2"cellpadding="1">


Например, cellspacing="2", или cellpadding="1", или даже оба. Как мне
указать это скраперу? Кстати, посоветуете другой инструмент, буду
непротив. С небольшим модулем, который парсит регулярками разобрался
быстро и доволен его работой, но хотелось бы разобраться с каким-нибудь
большим и стабильным инструментом для того, чтобы использовать его в
чрезмерно важных задачах.




Посмотрите на WWW::Mechanize (http://search.cpan.org/~jesse/WWW-Mechanize-1.70/).
Если я ничего не путаю, с его помощью подобные задачи решались просто.

--
С уважением,
Евгений Косов.
--
Moscow.pm mailing list
[email protected] | http://moscow.pm.org

Ответить