lucio pineda ha scritto:
Ciao, come da oggetto devo ricavare dal sito pagine gialle
1. ragione sociale,
2. indirizzo anagrafico e
3. codice avviamento postale

OpenOffice puo' collegarsi direttamente a una sorgente dati esterna purche' i dati siano organizzati come tabella (purtroppo non e' il tuo caso, ma magari riesci a farli mostrare in qualche altro formato e risolvi). Ad esempio, da Calc Inserisci - Collegamento a dati esterni, inserisci come URL: http://www.w3schools.com/html/html_tables.asp , aspetti un attimo per la lettura del file, poi scegli (sotto) la tabella HTML_1 e ti trovi i dati importati in Calc.

Vedendo la struttura del sito delle Pagine Gialle, che e' tipo
http://www.paginegialle.it/pgol/4-pizzerie/3-Milano%20%28MI%29
non penso che questo ti funzioni subito. Ma dato che e' tutto annotato bene in CSS, puoi farlo con JavaScript.

Non c'entra nulla con OpenOffice, quindi ti dico solo come cominciare e poi devi cavartela da solo o chiedere in un forum di JavaScript. In Firefox crei un nuovo segnalibro nella barra dei segnalibri con titolo "Estrai" e nell'indirizzo copi e incolli quanto segue:

javascript:%20alert('Inizio%20Analisi');%20var%20found=new%20Array();%20for(var%20i=0;i%20<%20window.document.getElementsByTagName("h2").length;i++)%20{if(document.getElementsByTagName("h2")[i].className=="rgs"){found.push(document.getElementsByTagName("h2")[i].childNodes[1].childNodes[0].wholeText);}%20}%20alert('Trovati:'%20+%20found);

Poi apri la pagina indicata sopra, fai clic su "Estrai" e ti elenca le ragioni sociali, con varie limitazioni; aggiustarlo in modo che funzioni bene e' un lavoro complesso e off-topic per questa lista; indirizzo e CAP invece dovrebbero essere un po' piu' semplici perche' sono meglio identificabili. Se fai bene l'estrazione l'importazione in OpenOffice poi e' indolore.

Ciao,
  Andrea.

---------------------------------------------------------------------
Per cancellarsi: [email protected]
Per informazioni: http://www.openoffice.org/it/
Per avviare una nuova discussione: [email protected]
Archivi: http://mail-archives.apache.org/mod_mbox/incubator-ooo-utenti-it

Rispondere a