Re: Что есть для обработки html в командной строке?

2009-04-18 Пенетрантность Serhiy Storchaka
Тихон Тарнавский wrote: On Fri, 17.04.2009 12:48:02 , Serhiy Storchaka wrote: -asxml и добиться, чтобы кодировка была указана правильная (возможно только utf-8). Возможно вручную перекодировать и приклеить ?xml version=1.0 encoding=utf-8? до или после tidy. Первое что попробовал. Увы.

Re: Что есть для обработки html в командной строке?

2009-04-17 Пенетрантность Serhiy Storchaka
Тихон Тарнавский wrote: On Wed, 15.04.2009 22:05:16 , Dmitry Nezhevenko wrote: эээ. это tidy ругнулся? Если да, то лучше глянуть, где именно. Хм.. Это ругнулся xml_grep, разве не видно? Ругнулся на файлы, которые tidy по идее должен был validate, correct and pretty-print. Судя по

Re: Что есть для обработки html в командной строке?

2009-04-16 Пенетрантность Aleksey Cheusov
Hello! On Tuesday 07 April 2009 16:21:09 Mikhail Gusarov wrote: VW Но вот что забавно, многие из распространенных XML-парсеров (gnome VW XML например) имеют специальный режим разбора HTML. Что при этом VW имеется в виду, не особенно разбирался. Но возможно, некоторое VW тайное

Re: Что есть для обработки html в командной строке?

2009-04-15 Пенетрантность Alexey Pechnikov
Hello! On Tuesday 07 April 2009 16:21:09 Mikhail Gusarov wrote: VW Но вот что забавно, многие из распространенных XML-парсеров (gnome VW XML например) имеют специальный режим разбора HTML. Что при этом VW имеется в виду, не особенно разбирался. Но возможно, некоторое VW тайное знание о

Что есть для обработки html в командной строке?

2009-04-04 Пенетрантность Тихон Тарнавский
Собственно, вопрос в теме. В идеале хочется что-то вроде cat + split/csplit + grep, но не для построчной, а для потеговой обработки (а аналог cat должен обрезать на стыках шапку и обрамляющие теги). aptitude search и гугль выдают множество где-то близко, но ничего в точности, потому интересуют

Re: Что есть для обработки html в командной строке?

2009-04-04 Пенетрантность Oleg Gashev
2009/4/4 Тихон Тарнавский tik...@lexpr.ru: Собственно, вопрос в теме. В идеале хочется что-то вроде cat + split/csplit + grep, но не для построчной, а для потеговой обработки (а аналог cat должен обрезать на стыках шапку и обрамляющие теги). xml_grep? -- Best regards, Oleg Gashev.