Re: [Python-es] scrapear un javascript

2017-01-30 Por tema Chema Cortes
Ahora mismo, alrededor de javascript se ha montado un ecosistema tan arcano que es dificil darte ideas generales que puedan aplicarse en cualquier caso. Lo único que se puede hacer es esperar a que el navegador acabe por mostrar todo el contenido y, aún así, nunca estarás seguro de que lo que muest

Re: [Python-es] scrapear un javascript

2017-01-29 Por tema Gonzalo V
gracias javi, muy útil tu respuesta. ¿que más se debería saber cómo para tener un camino más certero? El 27 ene. 2017 8:26 AM, "lasizoillo" escribió: > Buenas, > > Para hacer scraping en sitios que abusan de javascript, siempre que no > tengas unos criterios de eficiencia excesivos (en plan quie

Re: [Python-es] scrapear un javascript

2017-01-27 Por tema lasizoillo
Buenas, Para hacer scraping en sitios que abusan de javascript, siempre que no tengas unos criterios de eficiencia excesivos (en plan quiero un millón de requests hechas para mañana) y no te importe que el scraper use demasiada memoria, yo tiraría por echarle un vistazo a webdriver. Haces las prue

Re: [Python-es] scrapear un javascript

2017-01-26 Por tema Ignacio Rodríguez
*antes de hacer el read == obtener la info. On 1/27/17, Ignacio Rodríguez wrote: > Puede ser media boba mi respuesta (porque seguramente ya buscaste); > pero aca sugieren hacer un sleep despues de obtener la info: > > http://stackoverflow.com/questions/31310321/python-urllib2-wait-for-page-to-loa

Re: [Python-es] scrapear un javascript

2017-01-26 Por tema Ignacio Rodríguez
Puede ser media boba mi respuesta (porque seguramente ya buscaste); pero aca sugieren hacer un sleep despues de obtener la info: http://stackoverflow.com/questions/31310321/python-urllib2-wait-for-page-to-load-to-scrape-data No se si funciona con urllib (usan urllib2 en el ejemplo) On 1/27/17, G

[Python-es] scrapear un javascript

2017-01-26 Por tema Gonzalo V
Hola amigos. Estoy scrapeando un sitio web publico con urllib y beautifulsoup4 y hay unos tab o lenguetas que se llenan a través de javascript. ¿cómo podría obtener esa información? este es el link, el href Votaciones y no lo puedo abrir con urllib.request.urlopen alguien sabe cómo?, han tenido