On Sat, Apr 18, 2009 at 12:52:19PM +0300, Serhiy Storchaka wrote: > > В Konqueror есть плагин, позволяющий сохранить страницу в war-файле (Web > Archive, обычный tar.gz на самом деле). При этом он её как-то > преобразовывает, вероятно получается корректный html или xhtml. Возможно > удастся как-то задействовать его и в автоматическом режиме, через dcop или > что-то в этом роде. Аналогичной функциональности в других браузерах я не > нашёл.
Какой функциональности нет? Разбора в DOM нет, или сериализации? Можно использовать движок мозиллы можно перл использовать. Какой-нибудь питон или ява или libwww на С. Проблема в другом. С корректным html и у libtidy проблем не будет. С сильно битым -- везде будет каша. -- To UNSUBSCRIBE, email to [email protected] with a subject of "unsubscribe". Trouble? Contact [email protected]

