On Mon, Jul 01, 2002 at 03:35:20PM +0200, LAMY Olivier wrote:
> normalement, un html "bien form�" est tout simplement du xml donc parser du
> html revient � la m�me chose que de parser du xml.
> Avce un parser SAX ou du DOM pas de probl�me !

Oui, mais c'est l� qu'est l'os ! 
Le html que l'on trouve au fil de nos p�rigrinations sur le net sont 
rarement bien form�s. JTidy permet de faire le parsing HTML en r�sistant �
toutes les erreurs de syntaxes coutumi�res, mais c'est vrai qu'il est lent.


J�r�me.

> Olivier
> ----- Original Message -----
> From: <[EMAIL PROTECTED]>
> To: <[EMAIL PROTECTED]>
> Sent: Monday, July 01, 2002 3:38 PM
> Subject: Parser Code HTML
> 
> 
> > Bonjour,
> >
> > Existe t il une API Java permettant de parser du code HTML.
> >
> > Par exemple, pour r�cup�rer des hrefs, etc ...
> >
> > Merci par avance pour votre aide.
> >
> > Eddy PALISSE
> > --
> >
> > INGENCYS
> > Agence Conseil & Ing�nierie en Syst�mes d'Informations
> >
> > 20A, rue du Grand S�minaire
> > 28630 LE COUDRAY
> >
> > T�l. 02 37 25 12 00 - Fax : 02 37 25 12 01
> >
> > http://www.ingencys.net
> 

Répondre à