多谢你的建议,我大体搜了一下,找到了相关的信息。虽然目前我还看不太明白,不过至少给了我一个比较明确的方向。 再次感谢!
2011/1/13 伊现富 <[email protected]> > 你这是GenBank的格式吧。 > 去CPAN上搜索一下bioperl中读取GenBank的包,看一下说明文档就可以用了。 > 对于处理公认格式的工具,别人早就写好了。 > > 在 2011年1月13日 下午12:40,徐香�| <[email protected]>写道: > > >gnl(.*$) >> >> >> 2011-01-13 >> ------------------------------ >> 徐香�| >> ------------------------------ >> *发件人:* Fei Ni >> *发送时间:* 2011-01-13 12:21:01 >> *收件人:* perlchina >> *抄送:* >> *主题:* [PerlChina] 求助一个正则表达式的问题 >> 有一段文字: >> >>> <html> >>> >>> <bodybgcolor=white> >>> >>> <pre> >>> >>> SSOURCE=<ahref=" >>>> http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Search&db=Nucleotide&doptcmdl=GenBank&term=AY013246 >>>> ">AY013246</a> >>> >>> RELDATE=01-OCT-2002 >>> >>> ANN_TSD=1-5,5178-5182 >>> >>> ANN_LTR=6-208,4976-5177 >>> >>> PROTEIN= >>> >>> >>>> >gnl|TREP|TREP22Retrotransposon,LTR,Copia,"RLC_Inav_AY013246-1";completeelement(5bpTSD) >>> >>> CAACCTGTTAGACGAAATATCTCTTTGTATTATACGTGACTTGTATAACA >>> >>> CGTATAGGTTAGGATCTCTTTCTATCTCCTTGTGTTTAAACCGTAGATAA >>> >>> GATAGATTGATCTTAAACCTCTCCTCATGTATATCTCTTCGGCTTATGCT >>> >>> GCCTATATAAATATGCACGCGTCCCTGCTAAGAGCATACGCTTCCAGCCT >>> >>> TTCTCACATGGTATAAGAGCCACCTCTTCCATCGACATGTCATCTTCCTC >>> >>> CTCAAGCTCCACCATGGCTGCCTCCCTCGCTGCGCTAGGTCACACCATAA >>> >>> 我想只拿到 >gnl 后面一直到文件结尾的文字(红色部分,结尾的文字不固定,可能是AGCT里的任意一个),用正则表达式该怎么去写呢? >> 非常感谢大家的热心帮助!! >> >> PS1:本人刚接触Perl,正在看小骆驼书,是新手。 >> PS2:我花了至少一天的时间来写这个正则表达式,但一直没成功。 >> >> -- >> Feiny >> >> Achieving dream takes time and patience.Great careers don't happen >> overnight ,and take years of hardwork.But every step along the road can get >> you closer to your dream. >> >> -- >> 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 >> 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 >> 要取消订阅此网上论坛,请发送电子邮件至 >> [email protected]<perlchina%[email protected]> >> 。 >> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。 >> >> -- >> 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 >> 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 >> 要取消订阅此网上论坛,请发送电子邮件至 >> [email protected]<perlchina%[email protected]> >> 。 >> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。 >> > > -- > 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 > 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 > 要取消订阅此网上论坛,请发送电子邮件至 > [email protected]<perlchina%[email protected]> > 。 > 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。 > -- Feiny Achieving dream takes time and patience.Great careers don't happen overnight ,and take years of hardwork.But every step along the road can get you closer to your dream. -- 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。 要向此网上论坛发帖,请发送电子邮件至 [email protected]。 要取消订阅此网上论坛,请发送电子邮件至 [email protected]。 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
