Última chamada... visto ninguém mais fazer comentário, deduzo que não é possível resolver este problema com alguma ferramenta de shell. Começarei a estudar a solução em "C"
Se alguém ainda tiver uma sugestão, por favor me avise antes que eu começe ;-) Grato, Alain Alain M. escreveu: > Oi Bruno, > > Sim os "ids" dos divs são específicos. > > Respondi na minha própria mensagem porque tem o exemplo simplificado em > baixo, um exemplo do texto original seria esta página: > http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.html > e manda salvar como... ou abre direto o código fonte. Por exemplo nesta > página eu quero apagar os tags: > <div id="glbBarra" > <div id="lateral"> > > O exemplo abaixo deveria servir para testes, acho que contém todos os > casos encontrados > > Espero encontrar uma solução sem ter que escrever um programa sm C... > > Alain > > Alain M. escreveu: >> Ok, Bruno, não fui claro novamente, vou tentar de novo >> >> Na página, tem vários tags quecomeçam com "<div" eu quero tirar uma >> delas, no meu exemplo a que começa com '<div id="Label"' até o "</div>" >> *correspondente*. >> >> Só que dentro desse div tem outro div, então tem que achar o >> correspondente, independentemente de quantos tem aninhados dentro. >> >> Alain >> >> Bruno Gunter Fricke escreveu: >>> Alain, >>> >>> Você precisa encontrar um ponto em comum em seu texto para usar o sed. >>> Você quer manter algumas "divs" e outras não. Não tem como fazer o que >>> você deseja se não for informado exatamente o que você precisa cortar do >>> texto. >>> >>> Agradeço pelas dicas, mas acho que me expliquei mal. >>> >>> Dica do Tiago: sed '/^<div/,/^<\/div/d' arquivo >>> Dica do Flavio: tr '\n' '#' < txt | sed 's/<.*>//' | tr '#' '\n' >>> >>> Na verdade eu quero é tirar um TAG específico no meio de uma página >>> grande em html. Refiz meu exemplo para ficar mais claro, eu preciso >>> tirar o TAG que começa com: <div id="Label" >>> >>> -----Original----- >>> texto que fica <div class="Lxx">também fica</div> >>> <div id="Label" class="x1024"> >>> mais texto >>> <div class="Label2"></div> >>> lixo</div> >>> mais um que fica <div class="Lyy">ficante ídem</div> >>> >>> -----editado------ >>> texto que fica <div class="Lxx">também fica</div> >>> mais um que fica <div class="Lyy">ficante ídem</div> >>> >>> Só por curiosidade, a idéia é limpar páginas para ler offline no Palm. >>> Por exemplo: >>> http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.html >>> >>> Mais uma vez, grato, >>> Alain > > > > --------------------------------------------------------------------- > Esta lista não admite a abordagem de outras liguagens de programação, como > perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio > aviso. > --------------------------------------------------------------------- > Sair da lista: [EMAIL PROTECTED] > --------------------------------------------------------------------- > Esta lista é moderada de acordo com o previsto em > http://www.listas-discussao.cjb.net > --------------------------------------------------------------------- > Servidor Newsgroup da lista: news.gmane.org > Grupo: gmane.org.user-groups.programming.shell.brazil > > > Links do Yahoo! Grupos > > > >
