你这是GenBank的格式吧。 去CPAN上搜索一下bioperl中读取GenBank的包,看一下说明文档就可以用了。 对于处理公认格式的工具,别人早就写好了。
在 2011年1月13日 下午12:40,徐香�| <[email protected]>写道: > >gnl(.*$) > > > 2011-01-13 > ------------------------------ > 徐香�| > ------------------------------ > *发件人:* Fei Ni > *发送时间:* 2011-01-13 12:21:01 > *收件人:* perlchina > *抄送:* > *主题:* [PerlChina] 求助一个正则表达式的问题 > 有一段文字: > >> <html> >> >> <bodybgcolor=white> >> >> <pre> >> >> SSOURCE=<ahref=" >>> http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Search&db=Nucleotide&doptcmdl=GenBank&term=AY013246 >>> ">AY013246</a> >> >> RELDATE=01-OCT-2002 >> >> ANN_TSD=1-5,5178-5182 >> >> ANN_LTR=6-208,4976-5177 >> >> PROTEIN= >> >> >>> >gnl|TREP|TREP22Retrotransposon,LTR,Copia,"RLC_Inav_AY013246-1";completeelement(5bpTSD) >> >> CAACCTGTTAGACGAAATATCTCTTTGTATTATACGTGACTTGTATAACA >> >> CGTATAGGTTAGGATCTCTTTCTATCTCCTTGTGTTTAAACCGTAGATAA >> >> GATAGATTGATCTTAAACCTCTCCTCATGTATATCTCTTCGGCTTATGCT >> >> GCCTATATAAATATGCACGCGTCCCTGCTAAGAGCATACGCTTCCAGCCT >> >> TTCTCACATGGTATAAGAGCCACCTCTTCCATCGACATGTCATCTTCCTC >> >> CTCAAGCTCCACCATGGCTGCCTCCCTCGCTGCGCTAGGTCACACCATAA >> >> 我想只拿到 >gnl 后面一直到文件结尾的文字(红色部分,结尾的文字不固定,可能是AGCT里的任意一个),用正则表达式该怎么去写呢? > 非常感谢大家的热心帮助!! > > PS1:本人刚接触Perl,正在看小骆驼书,是新手。 > PS2:我花了至少一天的时间来写这个正则表达式,但一直没成功。 > > -- > Feiny > > Achieving dream takes time and patience.Great careers don't happen > overnight ,and take years of hardwork.But every step along the road can get > you closer to your dream. > > -- > 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 > 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 > 要取消订阅此网上论坛,请发送电子邮件至 > [email protected]<perlchina%[email protected]> > 。 > 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。 > > -- > 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 > 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 > 要取消订阅此网上论坛,请发送电子邮件至 > [email protected]<perlchina%[email protected]> > 。 > 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。 > -- 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 要取消订阅此网上论坛,请发送电子邮件至 [email protected]。 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
