Constantin Gavrilescu wrote:
> Je pensais que vous vouliez vous débarrasser de <body>. Modifier ce 
> pastie
> et le renvoyer ici.
> 
> http://codepad.org/APExUC7Y
> 
> Avec body: BODY_PATTERN.match(body)[0]
> Sans body: BODY_PATTERN.match(body)[1]
> 
> 
> 2009/5/18 Ze lo <[email protected]>

Oui en effet, vous aviez bien compris ce que je voulais.
C'est moi qui est mal compris la réponse. Pour supprimer le <body> 
j'utilisais gsub (ignorant que [1]faisait très bien l'affaire)
Pour en revenir à mon problème, je pense qu'il faut faire 2 cas :
- si le code html contient les balises <body> et </body>
- si le code html ne contient ces balises

J'ai beau essayer mais je n'y arrive pas .
Voici le code que j'ai essayé
PATTERN = /<\/head>.*<p>(\n)*<script/m
BODY_PATTERN = /<body.*<\/body>/m
if (BODY_PATTERN.match(h) == nil)
   h = PATTERN.match(h)[1]
   puts '===========test 2'
   puts h
else
   h = BODY_PATTERN.match(h)[0]

en sachant que lorsque le code html ne contient pas les balises <body> 
et </body>, il ressemble à ça :
<head>
<META http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>bienvenue</title>
<meta name="filetype" content="description">
<meta name="role" content="">
</head>
<div id="breadcrumbs"></div>

<!-- du code html (entre autre des paragraphes)-->
<p>

<script language="JavaScript" type="text/javascript"><!--
        contentPage.onload();
// --></script>
</p>

je souhaite récupérer tout ce qu'il y a entre </head> et <p>. (en 
excluant ces balises)
Mais mon pattern ne semble pas matché

Merci pour votre aide
-- 
Posted via http://www.ruby-forum.com/.

--~--~---------~--~----~------------~-------~--~----~
Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance" de 
Google Groups.
Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse 
[email protected]
Pour résilier votre abonnement envoyez un e-mail à l'adresse 
[email protected]
-~----------~----~----~----~------~----~------~--~---

Répondre à