> normalement, un html "bien form�" est tout simplement du xml donc parser
du
> html revient � la m�me chose que de parser du xml.
Non, HTML n'est pas du XML (HTML est bas� sur SGML mais pas sur XML (qui lui
m�me est aussi bas� sur SGML))
on peut ecrire :
<p>blablabla<br>
bliblibli</p>
Ce qui est du HTML bien form� mais du XML invalide.
ou bien encore
<script>
if(a<b) {
}
</script>
Pour avoir un HTML � la sauce XML, il faut utiliser XHTML.
Ca a la couleur du HTML mais ce n'est plus du HTML.
Quand � la question principale :
>Existe t il une API Java permettant de parser du code HTML.
La biblioth�que SWING incorpore un parser HTML.
voir :
http://java.sun.com/products/jfc/tsc/articles/bookmarks/index.html
Cordialement,
--------------------------------------------------------------------
Erik Mazoyer, Chef de projet
HyperOffice
6, rue Jacques Daguerre - 92565 Rueil-Malmaison Cedex
T�l. 01 41 96 96 76
Fax 01 41 96 96 77
M�l [EMAIL PROTECTED]
-----Message d'origine-----
De: LAMY Olivier [mailto:[EMAIL PROTECTED]]
Date: lundi 1 juillet 2002 15:35
�: [EMAIL PROTECTED]
Objet: Re: Parser Code HTML
normalement, un html "bien form�" est tout simplement du xml donc parser du
html revient � la m�me chose que de parser du xml.
Avce un parser SAX ou du DOM pas de probl�me !
Olivier
----- Original Message -----
From: <[EMAIL PROTECTED]>
To: <[EMAIL PROTECTED]>
Sent: Monday, July 01, 2002 3:38 PM
Subject: Parser Code HTML
> Bonjour,
>
> Existe t il une API Java permettant de parser du code HTML.
>
> Par exemple, pour r�cup�rer des hrefs, etc ...
>
> Merci par avance pour votre aide.
>
> Eddy PALISSE
> --
>
> INGENCYS
> Agence Conseil & Ing�nierie en Syst�mes d'Informations
>
> 20A, rue du Grand S�minaire
> 28630 LE COUDRAY
>
> T�l. 02 37 25 12 00 - Fax : 02 37 25 12 01
>
> http://www.ingencys.net
**********************************************************************
Ce message �lectronique et tous les fichiers joints ainsi que les
informations contenues dans ce message (ci apr�s "le message"), sont
confidentiels et destin�s exclusivement � l'usage de la personne � laquelle
ils sont adress�s. Si vous avez re�u ce message par erreur, merci de le
renvoyer � son �metteur et de le d�truire. Toute diffusion, publication,
totale ou partielle ou divulgation sous quelque forme que ce soit non
express�ment autoris�es de ce message, sont interdites.
**********************************************************************
This e-mail, any attachments and the information contained (herein " the
message") are confidential and intended solely for the use of the
addressee(s) if you have received this message in error please send it back
to the sender and delete it. Unauthorized publication, use, dissemination or
disclosure, either whole or partial, of this message is strictly
prohibited.