U >Zdaje się, że można użyć JTidy do konwersji HTML do poprawnego XHTML. O >ile pamiętam jeden z kumpli z pracy używał właśnie JTidy do parsowania >HTML w botach grających w gry przeglądarkowe. :) Nie wiem, czy catface >nie gadał już w tej sprawie z alexem? >
Jasne że gadał powiem więcej nawet dzięki Alexowi nastąpił spory postęp. Co do wycinania body to niezupełnie jest tak - na stronach z blogami wpisy to tak naprawdę url-e do właściwychj stron blogerów, na tym etapie projektu potrafię sobie wydłubać ze strony blogów WP adresy wpisów dalsze prace będą miały na celu połączenie się z każdym z nich i wyłowieniem tekstu - tu faktycznie myślę o wycięciu tagów z body a konkretniej jednego charakterystycznego w którym znajduje się wpis i zamianie na plain - text. Już niedługo urlop więc pewnie bedę miał czas nad tym posiedzieć. Pozdrawiam Catface
