Ciao [] ritornando finelmante al mio "malsano progetto", sto cercando di fare il parser della pagina web che ho scaricato.
usando python3, uso html.parser come modulo per fare il parsing. from html.parser import HTMLParser class TimeTableHTMLParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) def handle_starttag(self, tag, attrs): if tag == "tr": for x,y in attrs: if x.lower()=="class" and y.lower()=="testo2": print("Ho individuato il campo del giorno") oa il mio problema è come faccio a prelevare il contenuto di questo tag? dentro ho una sequenza di tag <td>, i primi tag hanno dei contenuti che devo prelevare, i successivi tag <td> contengono un tag <input> che negli attributi contiene altri valori che mi servono. come faccio a legarli uno con l'altro? come posso vedere al suo interno? se faccio hendle_data(data), mi vedo passare i dati contenuti in TUTTI i tag della pagina, non solo quelli di cui ho bisogno... come posso fare a discriminare quelli su cui devo lavorare? Tnx Byez -- Gollum1 Tesssssoro, dov'é il mio tessssoro... _______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python