Aha, one liner ai galera: $ tr '\n' ';' < arquivo | sed 's/--[0-9]/\n&/g;s/\.\.\./;&/g' | cut -c15- | cut -d\; -f1,5 | tr -d ';'
bom, vamos por partes: 1) o tr '\n' ';' troca todos os caracteres nova linha por ';' - util para usar o cut informando o delimitador de campos ';' 2) a primeira parte do sed coloca um nova-linha '\n' na frente de todos os --10:20:30-- , isto serve para que tenhamos uma linha por url com as informações que queremos... 3) eu fui analisando onde estão as informações necessarias. descobri que depois do ... se encontrava a resposta, então tratei de colocar um separador tambem. 4) o cut -c15- é para pegar só a url, tem outras formas de faze-lo... 5) o cut em si é o nosso ponto central. pegamos os campos 1 e 5 de cada linha e removemos o ';' entre eles com o tr final outra forma, alternativa, é esta: $ tr '\n' ';' < log.ping | sed 's/--[0-9\:]*--\ \ /\n&;/g;s/\.\.\./;&/g' | cut -d\; -f2,6 | tr -d ';' Assim eu posiciono um ; antes do html, o que deixa o cut bem parelho. evitei procurar a palavra http pois, sei la, ta funcionando assim. E também é domingo (pé de cachimbo) Po, ficou bonito... :) Em 12/02/06, Fabiano Caixeta Duarte <[EMAIL PROTECTED]> escreveu: > -----BEGIN PGP SIGNED MESSAGE----- > Hash: SHA1 > > Mostre o código de sua tentativa. > > Fabiano Caixeta Duarte > Consultor em soluções para Redes de Computadores > Ribeirão Preto - SP > > > Jorge Barros de Abreu escreveu: > > > Olá. > > Tenho um log com a estrutura que segue adiante. Gostaria de um script que, > > a partir desse log me retornasse mais ou menos a seguinte saída: > > > > http://www.dhnet.org.br/henrique/caminholuz/instrumentos.htm ... 404 Not > Found > > http://educar.sc.usp.br/otica/7instru.htm ... 200 OK > > http://www.starastronomy.org/TelescopeMaking/Links/index.html ... 403 > Access > > Forbidden > > > http://www.mercadolivre.com.br/jm/search?as_categ_id=4065&as_pr_categ_id=AD > ... > > 301 Moved Permanently > > http://lista.mercadolivre.com.br/_CategID_4065_PrCategId_AD_JSEA > > http://www.cineminhabrasil.com.br/cinema_detail.asp?ID=1228 302 Found > > http://www.erosmania.com.br > > > http://www.adorocinemabrasileiro.com.br/filmes/licao-de-amor-75/licao-de-amor-75.asp > ... > > failed: Tempo esgotado para conexão. > > http://adorocinema.cidadeinternet.com.br/ ... 200 OK > > > > Obrigado. > > > > O log é: > > > > > > --10:26:10-- http://www.dhnet.org.br/henrique/caminholuz/instrumentos.htm > > Connecting to www.dhnet.org.br[200.198.184.125]:80... connected. > > HTTP requisição enviada, aguardando resposta... 404 Not Found > > 10:26:11 ERRO 404: Not Found. > > > > --10:26:11-- http://educar.sc.usp.br/otica/7instru.htm > > Connecting to educar.sc.usp.br[143.107.225.48]:80... connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 10,553 [text/html] > > 200 OK > > > > --10:26:17-- http://www.starastronomy.org/TelescopeMaking/Links/index.html > > Connecting to www.starastronomy.org[64.19.189.166]:80... connected. > > HTTP requisição enviada, aguardando resposta... 403 Access Forbidden > > 10:26:18 ERRO 403: Access Forbidden. > > > > --10:26:18-- > > http://www.mercadolivre.com.br/jm/search?as_categ_id=4065&as_pr_categ_id=AD > > Connecting to www.mercadolivre.com.br[64.76.233.8]:80... connected. > > HTTP requisição enviada, aguardando resposta... 301 Moved Permanently > > Localização: > http://lista.mercadolivre.com.br/_CategID_4065_PrCategId_AD_JSEA > > [seguinte] > > --10:26:19-- > http://lista.mercadolivre.com.br/_CategID_4065_PrCategId_AD_JSEA > > Connecting to lista.mercadolivre.com.br[64.14.123.136]:80... connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 70,336 [text/html] > > 200 OK > > > > --10:26:20-- > http://novaescola.abril.com.br/ed/123_jun99/html/astronomia.htm > > Connecting to novaescola.abril.com.br[200.196.241.202]:80... connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 11,933 [text/html] > > 200 OK > > > > --10:26:21-- http://www.kirchgessner.net/audine.html > > Connecting to www.kirchgessner.net[212.227.119.83]:80... connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 3,846 [text/html] > > 200 OK > > > > --10:26:38-- http://www.mast.br/acervo.htm > > Connecting to www.mast.br[200.156.20.14]:80... connected. > > HTTP requisição enviada, aguardando resposta... 404 Not Found > > 10:26:39 ERRO 404: Not Found. > > > > --10:28:47-- http://www.cineminhabrasil.com.br/cinema_detail.asp?ID=1228 > > Connecting to www.cineminhabrasil.com.br[200.215.26.1]:80... connected. > > HTTP requisição enviada, aguardando resposta... 302 Found > > Localização: http://www.erosmania.com.br/dominios20/?ID=1228 [seguinte] > > --10:28:48-- http://www.erosmania.com.br/dominios20/?ID=1228 > > Connecting to www.erosmania.com.br[200.234.198.231]:80... connected. > > HTTP requisição enviada, aguardando resposta... 302 Object moved > > Localização: http://www.erosmania.com.br/ [seguinte] > > --10:28:48-- http://www.erosmania.com.br/ > > Connecting to www.erosmania.com.br[200.234.198.231]:80... connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 3,843 [text/html] > > 200 OK > > > > --10:28:49-- > > > http://www.adorocinemabrasileiro.com.br/filmes/licao-de-amor-75/licao-de-amor-75.asp > > Connecting to www.adorocinemabrasileiro.com.br[67.19.250.98]:80... failed: > > Tempo esgotado para conexão. > > Desistindo. > > > > --10:29:04-- http://adorocinema.cidadeinternet.com.br/ > > Connecting to adorocinema.cidadeinternet.com.br[200.42.38.55]:80... > connected. > > HTTP requisição enviada, aguardando resposta... 200 OK > > Tamanho: 325 [text/html] > > 200 OK > > > -----BEGIN PGP SIGNATURE----- > Version: GnuPG v1.2.7 (GNU/Linux) > Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org > > iD8DBQFD71Ws++b4Zs4fOnMRAvD5AJ94KnSFi9eUeEL2eUSkzFbZspirQQCeLeDd > PTlVQwo5OpZrFCbdn22Wkq0= > =+OoB > -----END PGP SIGNATURE----- > > > > --------------------------------------------------------------------- > Esta lista não admite a abordagem de outras liguagens de programação, como > perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio > aviso. > --------------------------------------------------------------------- > Sair da lista: [EMAIL PROTECTED] > --------------------------------------------------------------------- > Esta lista é moderada de acordo com o previsto em > http://www.listas-discussao.cjb.net > --------------------------------------------------------------------- > Servidor Newsgroup da lista: news.gmane.org > Grupo: gmane.org.user-groups.programming.shell.brazil > > > > > > Yahoo! Grupos, um serviço oferecido por: > > PUBLICIDADE > > ________________________________ Links do Yahoo! Grupos > > > Para visitar o site do seu grupo na web, acesse: > http://br.groups.yahoo.com/group/shell-script/ > > Para sair deste grupo, envie um e-mail para: > [EMAIL PROTECTED] > > O uso que você faz do Yahoo! Grupos está sujeito aos Termos do Serviço do > Yahoo!. -- Tiago B Peczenyj Linux User #405772 # cd /pub # more beer --------------------------------------------------------------------- Esta lista não admite a abordagem de outras liguagens de programação, como perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio aviso. --------------------------------------------------------------------- Sair da lista: [EMAIL PROTECTED] --------------------------------------------------------------------- Esta lista é moderada de acordo com o previsto em http://www.listas-discussao.cjb.net --------------------------------------------------------------------- Servidor Newsgroup da lista: news.gmane.org Grupo: gmane.org.user-groups.programming.shell.brazil Links do Yahoo! Grupos <*> Para visitar o site do seu grupo na web, acesse: http://br.groups.yahoo.com/group/shell-script/ <*> Para sair deste grupo, envie um e-mail para: [EMAIL PROTECTED] <*> O uso que você faz do Yahoo! Grupos está sujeito aos: http://br.yahoo.com/info/utos.html
