[CC21] Extraction d'informations spécifiques d'une page html

2005-06-28 Par sujet Joseph Thirionet

Bonjour la liste,

Ceci peut en intéresser quelques-uns.
Voici un script asp qui permet de récupérer des informations se trouvant 
dans une page html.

http://www.4guysfromrolla.com/webtech/031000-1.shtml
Script qui utilise le composant gratuit disponible ici:
http://www.alphasierrapapa.com/IisDev/Components/AspTear/

Cela fonctionne vraiment très bien.
Le seul inconvénient pour mes besoins actuels est que cela fonctionne sous 
microsoft.

J'aurais besoin d'un script PHP permettant de faire le même genre de travail.
Personne n'aurait cela dans ses tiroirs ?

Merci d'avance.


@+

Joseph


--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]



Re: [CC21] Extraction d'informations spécifiques d'une page html

2005-06-28 Par sujet Didier

Bonjour,

en PHP il y a ceci qui pourrait t'aider :

Bonne journée,
Didier


strip_tags
(PHP 3= 3.0.8, PHP 4 )

strip_tags -- Strip HTML and PHP tags from a string
Description
string strip_tags ( string str [, string allowable_tags])


This function tries to return a string with all HTML and PHP tags 
stripped from a given str. It errors on the side of caution in case of 
incomplete or bogus tags. It uses the same tag stripping state machine 
as the fgetss() function.


You can use the optional second parameter to specify tags which should 
not be stripped.


Note: allowable_tags was added in PHP 3.0.13 and PHP 4.0b3.


Example 1. strip_tags() example

?php
$string = strip_tags($string, 'abiu');
?





Joseph Thirionet wrote:

Ceci peut en intéresser quelques-uns.
Voici un script asp qui permet de récupérer des informations se trouvant 
dans une page html.

http://www.4guysfromrolla.com/webtech/031000-1.shtml
Script qui utilise le composant gratuit disponible ici:
http://www.alphasierrapapa.com/IisDev/Components/AspTear/

Cela fonctionne vraiment très bien.
Le seul inconvénient pour mes besoins actuels est que cela fonctionne 
sous microsoft.
J'aurais besoin d'un script PHP permettant de faire le même genre de 
travail.

Personne n'aurait cela dans ses tiroirs ?

Merci d'avance.


@+

Joseph




--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]



Re: [CC21] Extraction d'informations spécifiques d'une page html

2005-06-28 Par sujet Joseph Thirionet

Merci Didier pour la piste.

Cette fonction php permet de récupérer tout le contenu d'une variable en 
retirant les tags non désirés.

Ce dont j'ai besoin est légèrement différent en ce sens que :
- l'information à récupérer se trouve dans une page distante 
(http://www.mondomaine.be/mapage.htm)
- l'info à récupérer n'est pas le contenu total de la page mais une toute 
petite partie (un chiffre, une string, ...)


La page où je dois pomper l'info est générée par un soft de stats (donc sa 
structure ne change pas) qui écrit à la volée sans mise en db préalable.
Alors pour économiser les ressources serveur, je préfère récupérer les 
infos dèjà analysées par ce soft plutôt que de lancer x analyses des 
fichiers de log moi-même.
Je veux par exemple récupérer le nombre de visites uniques, les 10 premiers 
référants, ...


Le script asp dont je parlais permet ce genre d'exercice car il associe un 
numéro à chaque cellule trouvée dans la page web. Il suffit de lui indiquer 
le numéro de la cellule qui contient l'info à extraire et le tour est joué.


Ce genre de techique est parfois utilisée pour récupérer des infos météo ou 
des données financières.

Personne n'a un petit exemple php sous la main ?

@+
Joseph


At 11:19 28/06/2005 +0200, you wrote:

Bonjour,

en PHP il y a ceci qui pourrait t'aider :

Bonne journée,
Didier


strip_tags
(PHP 3= 3.0.8, PHP 4 )

strip_tags -- Strip HTML and PHP tags from a string
Description
string strip_tags ( string str [, string allowable_tags])


This function tries to return a string with all HTML and PHP tags stripped 
from a given str. It errors on the side of caution in case of incomplete 
or bogus tags. It uses the same tag stripping state machine as the 
fgetss() function.


You can use the optional second parameter to specify tags which should not 
be stripped.


Note: allowable_tags was added in PHP 3.0.13 and PHP 4.0b3.


Example 1. strip_tags() example

?php
$string = strip_tags($string, 'abiu');
?





Joseph Thirionet wrote:

Ceci peut en intéresser quelques-uns.
Voici un script asp qui permet de récupérer des informations se trouvant 
dans une page html.

http://www.4guysfromrolla.com/webtech/031000-1.shtml
Script qui utilise le composant gratuit disponible ici:
http://www.alphasierrapapa.com/IisDev/Components/AspTear/
Cela fonctionne vraiment très bien.
Le seul inconvénient pour mes besoins actuels est que cela fonctionne 
sous microsoft.

J'aurais besoin d'un script PHP permettant de faire le même genre de travail.
Personne n'aurait cela dans ses tiroirs ?
Merci d'avance.

@+
Joseph


--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]


--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]



Re: [CC21] Extraction d'informations spécifiques d'une page html

2005-06-28 Par sujet Didier

Bonjour,


Je vois un peu plus. A part écrire soi-même quelques lignes en PHP 
spécifiques à la page qui va servir de source de données, je ne vois pas 
vraiment de solutions existantes et surtout génériques...

ou alors jouer avec les fonctions d'expression régulières comme ereg()
Un peu ardu à utiliser au début mais très puissant...

Didier



Joseph Thirionet wrote:

Merci Didier pour la piste.

Cette fonction php permet de récupérer tout le contenu d'une variable en 
retirant les tags non désirés.

Ce dont j'ai besoin est légèrement différent en ce sens que :
- l'information à récupérer se trouve dans une page distante 
(http://www.mondomaine.be/mapage.htm)
- l'info à récupérer n'est pas le contenu total de la page mais une 
toute petite partie (un chiffre, une string, ...)


La page où je dois pomper l'info est générée par un soft de stats (donc 
sa structure ne change pas) qui écrit à la volée sans mise en db préalable.
Alors pour économiser les ressources serveur, je préfère récupérer les 
infos dèjà analysées par ce soft plutôt que de lancer x analyses des 
fichiers de log moi-même.
Je veux par exemple récupérer le nombre de visites uniques, les 10 
premiers référants, ...


Le script asp dont je parlais permet ce genre d'exercice car il associe 
un numéro à chaque cellule trouvée dans la page web. Il suffit de lui 
indiquer le numéro de la cellule qui contient l'info à extraire et le 
tour est joué.


Ce genre de techique est parfois utilisée pour récupérer des infos météo 
ou des données financières.

Personne n'a un petit exemple php sous la main ?

@+
Joseph


At 11:19 28/06/2005 +0200, you wrote:


Bonjour,

en PHP il y a ceci qui pourrait t'aider :

Bonne journée,
Didier


strip_tags
(PHP 3= 3.0.8, PHP 4 )

strip_tags -- Strip HTML and PHP tags from a string
Description
string strip_tags ( string str [, string allowable_tags])


This function tries to return a string with all HTML and PHP tags 
stripped from a given str. It errors on the side of caution in case of 
incomplete or bogus tags. It uses the same tag stripping state machine 
as the fgetss() function.


You can use the optional second parameter to specify tags which should 
not be stripped.


Note: allowable_tags was added in PHP 3.0.13 and PHP 4.0b3.


Example 1. strip_tags() example

?php
$string = strip_tags($string, 'abiu');
?





Joseph Thirionet wrote:


Ceci peut en intéresser quelques-uns.
Voici un script asp qui permet de récupérer des informations se 
trouvant dans une page html.

http://www.4guysfromrolla.com/webtech/031000-1.shtml
Script qui utilise le composant gratuit disponible ici:
http://www.alphasierrapapa.com/IisDev/Components/AspTear/
Cela fonctionne vraiment très bien.
Le seul inconvénient pour mes besoins actuels est que cela fonctionne 
sous microsoft.
J'aurais besoin d'un script PHP permettant de faire le même genre de 
travail.

Personne n'aurait cela dans ses tiroirs ?
Merci d'avance.

@+
Joseph



--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]





--
Cette liste vous est offerte par Emakina http://www.emakina.com/
Emakina: technologie et creativite au service de vos projets Web.
Desabonnement par mail : mailto:[EMAIL PROTECTED]