Je suis d�sol� pour cet abus de langage mais g�n�rant du html par du xsl
j'ai pris l'habitude ("bonne" je trouve ) de correctement �crire le html de
sortie par exemple <br /> au lieu de <br> (de toute j'y suis oblig� par
l'utilisation du xsl)
De plus :
<script>
if(a<b) {
}
</script>
�crit sous la forme :
<script>
if(<b) {
}
</script>
ou encore :
<script>
<![CDATA[
if(<b) {
}
]]>
</script>
ces deux formes m'appara�ssent correctes du point de vue xml.
De plus, il m'appara�t philosophiquement int�ressant de penser non plus html
mais xhtml (notamment pour le parsing)
Donc la presmi�re question de savoir commment parser du html peut �tre
r�solue par un parser xml si l'on est � la source du html que l'on parse et
que l'on prend soin d'en g�n�rer un qui respecte le standard xhtml.
Olivier
----- Original Message -----
From: "Erik Mazoyer" <[EMAIL PROTECTED]>
To: <[EMAIL PROTECTED]>
Sent: Monday, July 01, 2002 3:47 PM
Subject: RE: Parser Code HTML
> > normalement, un html "bien form�" est tout simplement du xml donc parser
> du
> > html revient � la m�me chose que de parser du xml.
>
> Non, HTML n'est pas du XML (HTML est bas� sur SGML mais pas sur XML (qui
lui
> m�me est aussi bas� sur SGML))
> on peut ecrire :
>
> <p>blablabla<br>
> bliblibli</p>
> Ce qui est du HTML bien form� mais du XML invalide.
>
> ou bien encore
> <script>
> if(a<b) {
> }
> </script>
>
> Pour avoir un HTML � la sauce XML, il faut utiliser XHTML.
> Ca a la couleur du HTML mais ce n'est plus du HTML.
>
>
> Quand � la question principale :
> >Existe t il une API Java permettant de parser du code HTML.
>
> La biblioth�que SWING incorpore un parser HTML.
> voir :
> http://java.sun.com/products/jfc/tsc/articles/bookmarks/index.html
>
> Cordialement,
>
> --------------------------------------------------------------------
> Erik Mazoyer, Chef de projet
> HyperOffice
> 6, rue Jacques Daguerre - 92565 Rueil-Malmaison Cedex
> T�l. 01 41 96 96 76
> Fax 01 41 96 96 77
> M�l [EMAIL PROTECTED]
>
> -----Message d'origine-----
> De: LAMY Olivier [mailto:[EMAIL PROTECTED]]
> Date: lundi 1 juillet 2002 15:35
> �: [EMAIL PROTECTED]
> Objet: Re: Parser Code HTML
>
>
> normalement, un html "bien form�" est tout simplement du xml donc parser
du
> html revient � la m�me chose que de parser du xml.
> Avce un parser SAX ou du DOM pas de probl�me !
> Olivier
> ----- Original Message -----
> From: <[EMAIL PROTECTED]>
> To: <[EMAIL PROTECTED]>
> Sent: Monday, July 01, 2002 3:38 PM
> Subject: Parser Code HTML
>
>
> > Bonjour,
> >
> > Existe t il une API Java permettant de parser du code HTML.
> >
> > Par exemple, pour r�cup�rer des hrefs, etc ...
> >
> > Merci par avance pour votre aide.
> >
> > Eddy PALISSE
> > --
> >
> > INGENCYS
> > Agence Conseil & Ing�nierie en Syst�mes d'Informations
> >
> > 20A, rue du Grand S�minaire
> > 28630 LE COUDRAY
> >
> > T�l. 02 37 25 12 00 - Fax : 02 37 25 12 01
> >
> > http://www.ingencys.net
>
>
>
> **********************************************************************
> Ce message �lectronique et tous les fichiers joints ainsi que les
> informations contenues dans ce message (ci apr�s "le message"), sont
> confidentiels et destin�s exclusivement � l'usage de la personne �
laquelle
> ils sont adress�s. Si vous avez re�u ce message par erreur, merci de le
> renvoyer � son �metteur et de le d�truire. Toute diffusion, publication,
> totale ou partielle ou divulgation sous quelque forme que ce soit non
> express�ment autoris�es de ce message, sont interdites.
>
> **********************************************************************
> This e-mail, any attachments and the information contained (herein " the
> message") are confidential and intended solely for the use of the
> addressee(s) if you have received this message in error please send it
back
> to the sender and delete it. Unauthorized publication, use, dissemination
or
> disclosure, either whole or partial, of this message is strictly
> prohibited.