Para manipular �rvores DOM de documentos HTML (e n�o XHTML) use o HttpUnit. � ideal para extrair informa��es mas, a qualidade do HTML pode impedir que voc� tenha acesso a qualquer campo (por exemplo, HTML "sujo" gerado por Word ou FrontPage). Use o Tidy para transformar o HTML em XHTML e ter maior controle (funciona bem com p�ginas + ou - bem formadas).
[]s Helder. ----- Original Message ----- From: "Sergio Luiz T. Gomes" <[EMAIL PROTECTED]> To: <[EMAIL PROTECTED]> Sent: Thursday, April 11, 2002 5:39 PM Subject: [java-list] Document Object Model > Preciso acessar uma p�gina HTML e extrair informa��es, fiquei sabendo que > para isso � usado a API DOM, algu�m tem algum exemplo e onde baixar essa API? > > Obrigado. > > --------------------------------------------------------------- > Sergio Luiz Theodorico Gomes - Analista de Sistemas > Softplan - Florian�polis - SC - Grupo SIDER > Sistema da Qualidade Certificado - ISO9001 > BVQI - INMETRO > e-mail: [EMAIL PROTECTED] <mailto:[EMAIL PROTECTED]> > --------------------------------------------------------------- > > ------------------------------ LISTA SOUJAVA ---------------------------- > http://www.soujava.org.br - Sociedade de Usu�rios Java da Sucesu-SP > d�vidas mais comuns: http://www.soujava.org.br/faq.htm > regras da lista: http://www.soujava.org.br/regras.htm > historico: http://www.mail-archive.com/java-list%40soujava.org.br > para sair da lista: envie email para [EMAIL PROTECTED] > ------------------------------------------------------------------------- > ------------------------------ LISTA SOUJAVA ---------------------------- http://www.soujava.org.br - Sociedade de Usu�rios Java da Sucesu-SP d�vidas mais comuns: http://www.soujava.org.br/faq.htm regras da lista: http://www.soujava.org.br/regras.htm historico: http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: envie email para [EMAIL PROTECTED] -------------------------------------------------------------------------
