Tente isso: sed -r 's/<[^>]+>//g' file
Entretanto não vai funcionar se vc tiver algo como <a href="xxx">.... Pois sed não é multilinha ;-) 2008/1/30 César Vianna <[EMAIL PROTECTED]>: > > > Preciso remover as tags de um html e só imprimir o texto. > > cat teste.html > > <tag1> abc </tag1> <tag2> > <tag3> abcdef </tag2></tag3> > > Tentei com: > > sed "s/<.*>\(.*\)/\1/g" teste.html > > mas como o * é guloso, o resultado é vazio. > > tentei assim > sed "s/<.*>\(.*\)<\/.*>/\1/g" teste.html > > mas o resultado é apenas a primeira ocorrência > abc > > Alguma dica? > > [As partes desta mensagem que não continham texto foram removidas] > > -- Tiago B Peczenyj Linux User #405772 http://peczenyj.blogspot.com/ "what does not kill us makes us stronger"
