Ciao []

ritornando finelmante al mio "malsano progetto", sto cercando di fare
il parser della pagina web che ho scaricato.

usando python3, uso html.parser come modulo per fare il parsing.

from html.parser import HTMLParser

class TimeTableHTMLParser(HTMLParser):

    def __init__(self):
                HTMLParser.__init__(self)

    def handle_starttag(self, tag, attrs):
        if tag == "tr":
            for x,y in attrs:
                if x.lower()=="class" and y.lower()=="testo2":
                    print("Ho individuato il campo del giorno")

oa il mio problema è come faccio a prelevare il contenuto di questo tag?

dentro ho una sequenza di tag <td>, i primi tag hanno dei contenuti
che devo prelevare,
i successivi tag <td> contengono un tag <input> che negli attributi
contiene altri valori che mi servono.

come faccio a legarli uno con l'altro? come posso vedere al suo interno?

se faccio hendle_data(data), mi vedo passare i dati contenuti in TUTTI
i tag della pagina, non solo quelli di cui ho bisogno... come posso
fare a discriminare quelli su cui devo lavorare?

Tnx

Byez
-- 
Gollum1
Tesssssoro, dov'é il mio tessssoro...
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a