On Sat, 18.04.2009 12:52:19 , Serhiy Storchaka wrote: > Тихон Тарнавский wrote: > > On Fri, 17.04.2009 12:48:02 , Serhiy Storchaka wrote: > >> -asxml и добиться, чтобы кодировка была указана правильная (возможно > >> только utf-8). Возможно вручную перекодировать и приклеить <?xml > >> version="1.0" encoding="utf-8"?> до или после tidy. > > Первое что попробовал. Увы. > > Некоторые html так плохи, что tidy отказывается с ними работать. Как > заставить его игнорировать все ошибки, я не знаю. > > В Konqueror есть плагин, позволяющий сохранить страницу в war-файле (Web > Archive, обычный tar.gz на самом деле). При этом он её как-то > преобразовывает, вероятно получается корректный html или xhtml. Возможно > удастся как-то задействовать его и в автоматическом режиме, через dcop или > что-то в этом роде. Аналогичной функциональности в других браузерах я не > нашёл.
Мне не так уж много надо, чтобы ради этого с dcop-ом возиться; тем более, что konqueror в этом смысле тоже штука непредсказуемая: никогда наперёд не знаешь, на какой именно "каше из тегов" он споткнётся и даже сам правильно отобразить не сумеет. К тому же какой-нибудь htmlcat всё равно придётся написать самому: xml_merge объединение "каких попало" html-ей не обеспечит, даже если их к нужному виду привести. -- С уважением, Тихон Тарнавский. http://linuxforum.ru http://posix.ru -- To UNSUBSCRIBE, email to [email protected] with a subject of "unsubscribe". Trouble? Contact [email protected]

