[Rio-pm] Dúvida regex

2013-03-12 Por tôpico André Torres
Oi pessoa,

estou precisando da ajuda de vcs em um problema idiota.
eu jogo as imformações contidas na primeira coluna de um arquivo txt em um
array, mas o problema é que nao consigo uma maneira de uniformizar o regex
para fazer o match e subsequente extração dos elementos para o array pois
existem caracteres especiais como pontos, pipes, barras, hifens entre
outros nos meios dos elementos.

eu tentei isso:

next unless m/^.+\s+\w+=\d+/;

existe outra forma a nao ser usar o ponto para encontrar qualquer caracter?


Muito obrigado.

-- 
André Torres

Quando o homem aprender a respeitar até o menor ser da criação, seja
animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
(Albert Schweitzer - Nobel da Paz de 1952)
___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

Re: [Rio-pm] Dúvida regex

2013-03-12 Por tôpico Tiago Peczenyj
De exemplos
Em 12/03/2013 20:03, André Torres andretorre...@gmail.com escreveu:

 Oi pessoa,

 estou precisando da ajuda de vcs em um problema idiota.
 eu jogo as imformações contidas na primeira coluna de um arquivo txt em um
 array, mas o problema é que nao consigo uma maneira de uniformizar o regex
 para fazer o match e subsequente extração dos elementos para o array pois
 existem caracteres especiais como pontos, pipes, barras, hifens entre
 outros nos meios dos elementos.

 eu tentei isso:

 next unless m/^.+\s+\w+=\d+/;

 existe outra forma a nao ser usar o ponto para encontrar qualquer caracter?


 Muito obrigado.

 --
 André Torres

 Quando o homem aprender a respeitar até o menor ser da criação, seja
 animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
 (Albert Schweitzer - Nobel da Paz de 1952)
 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm

___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

Re: [Rio-pm] Dúvida regex

2013-03-12 Por tôpico Tiago Peczenyj
Então eu acho que não entendi a sua duvida.

Tipo isso são colunas? vc quer extrair o que de cada uma delas?

por exemplo

AAEL00987-PA quero extrair: 00987
BA89.ES-PB quero extrair: PB
gi|llum0001334.1-PA não quero isso.

2013/3/12 André Torres andretorre...@gmail.com:
 ai vao alguns que posso encontrar na minha coluna:

 AAEL00987-PA
 BA89.ES-PB
 gi|llum0001334.1-PA

 Obrigado.

 Em 12 de março de 2013 20:05, Tiago Peczenyj tiago.pecze...@gmail.com
 escreveu:

 De exemplos

 Em 12/03/2013 20:03, André Torres andretorre...@gmail.com escreveu:

 Oi pessoa,

 estou precisando da ajuda de vcs em um problema idiota.
 eu jogo as imformações contidas na primeira coluna de um arquivo txt em
 um array, mas o problema é que nao consigo uma maneira de uniformizar o
 regex para fazer o match e subsequente extração dos elementos para o array
 pois existem caracteres especiais como pontos, pipes, barras, hifens entre
 outros nos meios dos elementos.

 eu tentei isso:

 next unless m/^.+\s+\w+=\d+/;

 existe outra forma a nao ser usar o ponto para encontrar qualquer
 caracter?


 Muito obrigado.

 --
 André Torres

 Quando o homem aprender a respeitar até o menor ser da criação, seja
 animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
 (Albert Schweitzer - Nobel da Paz de 1952)
 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm


 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm




 --
 André Torres

 Quando o homem aprender a respeitar até o menor ser da criação, seja animal
 ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante. (Albert
 Schweitzer - Nobel da Paz de 1952)

 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm



-- 
Tiago B. Peczenyj
Linux User #405772

http://about.me/peczenyj
___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm


Re: [Rio-pm] Dúvida regex

2013-03-12 Por tôpico André Torres
Desculpa, isso realmente deve ser simples e nao estou sabendo expressar a
minha duvida.

ai vai um pedaço completo do arquivo. O que eu queria era um regex capaz de
identificar as linhas que contem os resultados (ex: F55F3.2b
548  0.025  0.970  0.051   S1) e dai começar a extração dos
itens da coluna.

Obrigado.

### targetp v1.1 prediction results ##
Number of query sequences:  516
Cleavage site predictions not included.
Using NON-PLANT networks.

Name  LenmTP SP  other  Loc  RC
--
F55F3.2b  548  0.025  0.970  0.051   S1
DSIM0209463   685  0.193  0.839  0.025   S2
PB13537-PA272  0.081  0.063  0.906   _1
CPIJ016026-PA 575  0.109  0.844  0.093   S2
RPTMP00928-PA 595  0.028  0.909  0.148   S2
DSEC0203033   685  0.171  0.860  0.024   S2

Em 12 de março de 2013 20:32, Tiago Peczenyj tiago.pecze...@gmail.comescreveu:

 Então eu acho que não entendi a sua duvida.

 Tipo isso são colunas? vc quer extrair o que de cada uma delas?

 por exemplo

 AAEL00987-PA quero extrair: 00987
 BA89.ES-PB quero extrair: PB
 gi|llum0001334.1-PA não quero isso.

 2013/3/12 André Torres andretorre...@gmail.com:
  ai vao alguns que posso encontrar na minha coluna:
 
  AAEL00987-PA
  BA89.ES-PB
  gi|llum0001334.1-PA
 
  Obrigado.
 
  Em 12 de março de 2013 20:05, Tiago Peczenyj tiago.pecze...@gmail.com
  escreveu:
 
  De exemplos
 
  Em 12/03/2013 20:03, André Torres andretorre...@gmail.com escreveu:
 
  Oi pessoa,
 
  estou precisando da ajuda de vcs em um problema idiota.
  eu jogo as imformações contidas na primeira coluna de um arquivo txt em
  um array, mas o problema é que nao consigo uma maneira de uniformizar o
  regex para fazer o match e subsequente extração dos elementos para o
 array
  pois existem caracteres especiais como pontos, pipes, barras, hifens
 entre
  outros nos meios dos elementos.
 
  eu tentei isso:
 
  next unless m/^.+\s+\w+=\d+/;
 
  existe outra forma a nao ser usar o ponto para encontrar qualquer
  caracter?
 
 
  Muito obrigado.
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
  animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
  (Albert Schweitzer - Nobel da Paz de 1952)
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
 
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
 animal
  ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante. (Albert
  Schweitzer - Nobel da Paz de 1952)
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm



 --
 Tiago B. Peczenyj
 Linux User #405772

 http://about.me/peczenyj
 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm




-- 
André Torres

Quando o homem aprender a respeitar até o menor ser da criação, seja
animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
(Albert Schweitzer - Nobel da Paz de 1952)
___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

Re: [Rio-pm] Dúvida regex

2013-03-12 Por tôpico Renan Rangel
Tente com a regex: /^([\w\d|.-]+)/

Ela deveria pegar qualquer coisa que contenha letras, números, e outros
caracteres que você falou, tipo pipe, ponto, traço. Cada vez que o loop
rodar, o valor da chave vai ficar disponível em $1 para você colocar no
array.

Outra forma, se nenhuma dessas chaves contém espaço, é usar: /^[^\s]+/


Renan Rangel


2013/3/12 André Torres andretorre...@gmail.com

 Desculpa, isso realmente deve ser simples e nao estou sabendo expressar a
 minha duvida.

 ai vai um pedaço completo do arquivo. O que eu queria era um regex capaz
 de identificar as linhas que contem os resultados (ex:
 F55F3.2b  548  0.025  0.970  0.051   S1) e dai
 começar a extração dos itens da coluna.

 Obrigado.

 ### targetp v1.1 prediction results ##
 Number of query sequences:  516
 Cleavage site predictions not included.
 Using NON-PLANT networks.

 Name  LenmTP SP  other  Loc  RC
 --
 F55F3.2b  548  0.025  0.970  0.051   S1
 DSIM0209463   685  0.193  0.839  0.025   S2
 PB13537-PA272  0.081  0.063  0.906   _1
 CPIJ016026-PA 575  0.109  0.844  0.093   S2
 RPTMP00928-PA 595  0.028  0.909  0.148   S2
 DSEC0203033   685  0.171  0.860  0.024   S2

 Em 12 de março de 2013 20:32, Tiago Peczenyj 
 tiago.pecze...@gmail.comescreveu:

 Então eu acho que não entendi a sua duvida.

 Tipo isso são colunas? vc quer extrair o que de cada uma delas?

 por exemplo

 AAEL00987-PA quero extrair: 00987
 BA89.ES-PB quero extrair: PB
 gi|llum0001334.1-PA não quero isso.

 2013/3/12 André Torres andretorre...@gmail.com:
  ai vao alguns que posso encontrar na minha coluna:
 
  AAEL00987-PA
  BA89.ES-PB
  gi|llum0001334.1-PA
 
  Obrigado.
 
  Em 12 de março de 2013 20:05, Tiago Peczenyj tiago.pecze...@gmail.com
  escreveu:
 
  De exemplos
 
  Em 12/03/2013 20:03, André Torres andretorre...@gmail.com
 escreveu:
 
  Oi pessoa,
 
  estou precisando da ajuda de vcs em um problema idiota.
  eu jogo as imformações contidas na primeira coluna de um arquivo txt
 em
  um array, mas o problema é que nao consigo uma maneira de uniformizar
 o
  regex para fazer o match e subsequente extração dos elementos para o
 array
  pois existem caracteres especiais como pontos, pipes, barras, hifens
 entre
  outros nos meios dos elementos.
 
  eu tentei isso:
 
  next unless m/^.+\s+\w+=\d+/;
 
  existe outra forma a nao ser usar o ponto para encontrar qualquer
  caracter?
 
 
  Muito obrigado.
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
  animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
  (Albert Schweitzer - Nobel da Paz de 1952)
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
 
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
 animal
  ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante. (Albert
  Schweitzer - Nobel da Paz de 1952)
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm



 --
 Tiago B. Peczenyj
 Linux User #405772

 http://about.me/peczenyj
 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm




 --
 André Torres

 Quando o homem aprender a respeitar até o menor ser da criação, seja
 animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
 (Albert Schweitzer - Nobel da Paz de 1952)

 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm

___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

Re: [Rio-pm] Dúvida regex

2013-03-12 Por tôpico Tiago Peczenyj
2013/3/12 André Torres andretorre...@gmail.com:
 Desculpa, isso realmente deve ser simples e nao estou sabendo expressar a
 minha duvida.

Isso se ganha com o tempo.

Veja se isso resolve:

https://gist.github.com/anonymous/aa5d7d06ed311a2200c3


 ai vai um pedaço completo do arquivo. O que eu queria era um regex capaz de
 identificar as linhas que contem os resultados (ex: F55F3.2b
 548  0.025  0.970  0.051   S1) e dai começar a extração dos
 itens da coluna.

 Obrigado.

 ### targetp v1.1 prediction results ##
 Number of query sequences:  516
 Cleavage site predictions not included.
 Using NON-PLANT networks.

 Name  LenmTP SP  other  Loc  RC
 --
 F55F3.2b  548  0.025  0.970  0.051   S1
 DSIM0209463   685  0.193  0.839  0.025   S2
 PB13537-PA272  0.081  0.063  0.906   _1
 CPIJ016026-PA 575  0.109  0.844  0.093   S2
 RPTMP00928-PA 595  0.028  0.909  0.148   S2
 DSEC0203033   685  0.171  0.860  0.024   S2

 Em 12 de março de 2013 20:32, Tiago Peczenyj tiago.pecze...@gmail.com
 escreveu:

 Então eu acho que não entendi a sua duvida.

 Tipo isso são colunas? vc quer extrair o que de cada uma delas?

 por exemplo

 AAEL00987-PA quero extrair: 00987
 BA89.ES-PB quero extrair: PB
 gi|llum0001334.1-PA não quero isso.

 2013/3/12 André Torres andretorre...@gmail.com:
  ai vao alguns que posso encontrar na minha coluna:
 
  AAEL00987-PA
  BA89.ES-PB
  gi|llum0001334.1-PA
 
  Obrigado.
 
  Em 12 de março de 2013 20:05, Tiago Peczenyj tiago.pecze...@gmail.com
  escreveu:
 
  De exemplos
 
  Em 12/03/2013 20:03, André Torres andretorre...@gmail.com escreveu:
 
  Oi pessoa,
 
  estou precisando da ajuda de vcs em um problema idiota.
  eu jogo as imformações contidas na primeira coluna de um arquivo txt
  em
  um array, mas o problema é que nao consigo uma maneira de uniformizar
  o
  regex para fazer o match e subsequente extração dos elementos para o
  array
  pois existem caracteres especiais como pontos, pipes, barras, hifens
  entre
  outros nos meios dos elementos.
 
  eu tentei isso:
 
  next unless m/^.+\s+\w+=\d+/;
 
  existe outra forma a nao ser usar o ponto para encontrar qualquer
  caracter?
 
 
  Muito obrigado.
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
  animal ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante.
  (Albert Schweitzer - Nobel da Paz de 1952)
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm
 
 
 
 
  --
  André Torres
 
  Quando o homem aprender a respeitar até o menor ser da criação, seja
  animal
  ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante. (Albert
  Schweitzer - Nobel da Paz de 1952)
 
  ___
  Rio-pm mailing list
  Rio-pm@pm.org
  http://mail.pm.org/mailman/listinfo/rio-pm



 --
 Tiago B. Peczenyj
 Linux User #405772

 http://about.me/peczenyj
 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm




 --
 André Torres

 Quando o homem aprender a respeitar até o menor ser da criação, seja animal
 ou vegetal, ninguém precisará ensiná-lo a amar seu semelhante. (Albert
 Schweitzer - Nobel da Paz de 1952)

 ___
 Rio-pm mailing list
 Rio-pm@pm.org
 http://mail.pm.org/mailman/listinfo/rio-pm



-- 
Tiago B. Peczenyj
Linux User #405772

http://about.me/peczenyj
___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm