Constantin Gavrilescu wrote:
> Je pensais que vous vouliez vous débarrasser de <body>. Modifier ce
> pastie
> et le renvoyer ici.
>
> http://codepad.org/APExUC7Y
>
> Avec body: BODY_PATTERN.match(body)[0]
> Sans body: BODY_PATTERN.match(body)[1]
>
>
> 2009/5/18 Ze lo <[email protected]>
Oui en effet, vous aviez bien compris ce que je voulais.
C'est moi qui est mal compris la réponse. Pour supprimer le <body>
j'utilisais gsub (ignorant que [1]faisait très bien l'affaire)
Pour en revenir à mon problème, je pense qu'il faut faire 2 cas :
- si le code html contient les balises <body> et </body>
- si le code html ne contient ces balises
J'ai beau essayer mais je n'y arrive pas .
Voici le code que j'ai essayé
PATTERN = /<\/head>.*<p>(\n)*<script/m
BODY_PATTERN = /<body.*<\/body>/m
if (BODY_PATTERN.match(h) == nil)
h = PATTERN.match(h)[1]
puts '===========test 2'
puts h
else
h = BODY_PATTERN.match(h)[0]
en sachant que lorsque le code html ne contient pas les balises <body>
et </body>, il ressemble à ça :
<head>
<META http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>bienvenue</title>
<meta name="filetype" content="description">
<meta name="role" content="">
</head>
<div id="breadcrumbs"></div>
<!-- du code html (entre autre des paragraphes)-->
<p>
<script language="JavaScript" type="text/javascript"><!--
contentPage.onload();
// --></script>
</p>
je souhaite récupérer tout ce qu'il y a entre </head> et <p>. (en
excluant ces balises)
Mais mon pattern ne semble pas matché
Merci pour votre aide
--
Posted via http://www.ruby-forum.com/.
--~--~---------~--~----~------------~-------~--~----~
Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance" de
Google Groups.
Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse
[email protected]
Pour résilier votre abonnement envoyez un e-mail à l'adresse
[email protected]
-~----------~----~----~----~------~----~------~--~---