On Mon, Jul 01, 2002 at 03:35:20PM +0200, LAMY Olivier wrote: > normalement, un html "bien form�" est tout simplement du xml donc parser du > html revient � la m�me chose que de parser du xml. > Avce un parser SAX ou du DOM pas de probl�me !
Oui, mais c'est l� qu'est l'os ! Le html que l'on trouve au fil de nos p�rigrinations sur le net sont rarement bien form�s. JTidy permet de faire le parsing HTML en r�sistant � toutes les erreurs de syntaxes coutumi�res, mais c'est vrai qu'il est lent. J�r�me. > Olivier > ----- Original Message ----- > From: <[EMAIL PROTECTED]> > To: <[EMAIL PROTECTED]> > Sent: Monday, July 01, 2002 3:38 PM > Subject: Parser Code HTML > > > > Bonjour, > > > > Existe t il une API Java permettant de parser du code HTML. > > > > Par exemple, pour r�cup�rer des hrefs, etc ... > > > > Merci par avance pour votre aide. > > > > Eddy PALISSE > > -- > > > > INGENCYS > > Agence Conseil & Ing�nierie en Syst�mes d'Informations > > > > 20A, rue du Grand S�minaire > > 28630 LE COUDRAY > > > > T�l. 02 37 25 12 00 - Fax : 02 37 25 12 01 > > > > http://www.ingencys.net >
