Problema resolvido, muito obrigada a todos.
Douglas, o mestrado vai bem, já tou na reta final, mas quelquer dúvida é só
entrar em contato. Seu script extrai o que eu quero, mas tá em loop.
Acho que não expliquei com clareza o que eu quero, mas o Cistian e o Marcio
conseguiram entender, valeu! :)
Mas não entendi alguma coisas no comando sed -n
'/>.*/{N;s/\(.*\)\n\(...\).*/\
1: \2/p}' dna.txt. O que seria 'N', ele pula linhas?
Abs.
On Sun, Mar 14, 2010 at 7:31 PM, Marcio Gil <[email protected]> wrote:
>
>
> Resolvendo em uma linha com sed:
>
> $ sed -n '/>.*/{N;s/.*\n\(...\).*/\1/p}' dna.txt
> gtg
> atg
> atg
> atg
>
> ou, se você quiser manter o identificador da sequência:
>
> $ sed -n '/>.*/{N;s/\(.*\)\n\(...\).*/\1: \2/p}' dna.txt
> >fig|674.13.peg.56: gtg
> >fig|674.13.peg.57: atg
> >fig|674.13.peg.58: atg
> >fig|674.13.peg.59: atg
>
> Nota: Eu criei o arquivo dna.txt com o exemplo que você passou.
>
>
> > -----Original Message-----
> > From: Graciela
> >
> > Trabalho com bioinformática e queria tirar uma dúvida com vocês
> > Tou com essas sequências de DNA, cada '>' representa uma sequência
>
> > Quero verificar apenas as três primeira letras de cada
> > sequência, por shel script tem como?
> >
> > >fig|674.13.peg.56
> > gtgacgttaggtgacaatgttgttgttgcctcgggagccgttgtgacaaagagttttggt
> > agcaatgttgtcattggtggcaacccagcacgagtgttaaaagaaatcgagtaa
> > >fig|674.13.peg.57
> > atgtcaatatacccaactgcaccccaaggtgtgtcagttgatgccaatatgaaaatgata
> > aagcaaaagtttggccgcattgttggcccaactgatttctattggttttatgaacaggtt
> > agaaataaaggcccgtgggattataaacaaagtggcccgtttgaaaatttcggtaatttt
> > cattatggggcagttggttatgcaggtggcattccagaagaagttttgttaagagctgct
> > ggttgtgctcaaatgaaggcgggtacttcagctgatagctggggtagttgttggagcgat
> > caaccatttggagatgatccaaacgatcaacgttatatagcactaggtattgaatatgca
> > aaaagtaaaggctattag
> > >fig|674.13.peg.58
> > atgaacgtggataaagcgaaaaaacgcatattgaaacgagtacaaagaggtttcaaaggt
> > tatccgcaaatatctttagagtatttcgggaaaacgacagattttgctaccgaagtagtc
> > atcacttttgttcctgaagaaaacgctgaagcgcaaattcagagatttacgagtgataag
> > gatgttcgtgaagatgaagcaattcaatcggtattgttgaaaattattgagcgagccgac
> > gctgctacggttttagaaagccgagaagtatcagtttgttaa
> > >fig|674.13.peg.59
> > atgccagttgttggacaccttcaagtggtgacaaattgggatggtataccgatttgtatt
> > atagaaatgacgtctgtaaccaagcaaaaatacagcgaagtaacaccggagttcgcggct
> > ttagaaggtgagggtgacaagactttagcttggtggcgggaggcgcattggaacttcttc
> > tcaaaagagtgcgtagagttagaaatatcaccgtcggaagatatgttgctggttctagag
> > cagttcaaagtggtgtacaaataa
> >
> >
>
>
>
[As partes desta mensagem que não continham texto foram removidas]
------------------------------------
---------------------------------------------------------------------
Esta lista não admite a abordagem de outras liguagens de programação, como
perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio
aviso.
---------------------------------------------------------------------
Sair da lista: [email protected]
---------------------------------------------------------------------
Esta lista é moderada de acordo com o previsto em
http://www.listas-discussao.cjb.net
---------------------------------------------------------------------
Servidor Newsgroup da lista: news.gmane.org
Grupo: gmane.org.user-groups.programming.shell.brazil
Links do Yahoo! Grupos
<*> Para visitar o site do seu grupo na web, acesse:
http://br.groups.yahoo.com/group/shell-script/
<*> Para sair deste grupo, envie um e-mail para:
[email protected]
<*> O uso que você faz do Yahoo! Grupos está sujeito aos:
http://br.yahoo.com/info/utos.html