Ahora mismo, alrededor de javascript se ha montado un ecosistema tan arcano
que es dificil darte ideas generales que puedan aplicarse en cualquier
caso. Lo único que se puede hacer es esperar a que el navegador acabe por
mostrar todo el contenido y, aún así, nunca estarás seguro de que lo que
muest
gracias javi, muy útil tu respuesta. ¿que más se debería saber cómo para
tener un camino más certero?
El 27 ene. 2017 8:26 AM, "lasizoillo" escribió:
> Buenas,
>
> Para hacer scraping en sitios que abusan de javascript, siempre que no
> tengas unos criterios de eficiencia excesivos (en plan quie
Buenas,
Para hacer scraping en sitios que abusan de javascript, siempre que no
tengas unos criterios de eficiencia excesivos (en plan quiero un
millón de requests hechas para mañana) y no te importe que el scraper
use demasiada memoria, yo tiraría por echarle un vistazo a webdriver.
Haces las prue
*antes de hacer el read == obtener la info.
On 1/27/17, Ignacio Rodríguez wrote:
> Puede ser media boba mi respuesta (porque seguramente ya buscaste);
> pero aca sugieren hacer un sleep despues de obtener la info:
>
> http://stackoverflow.com/questions/31310321/python-urllib2-wait-for-page-to-loa
Puede ser media boba mi respuesta (porque seguramente ya buscaste);
pero aca sugieren hacer un sleep despues de obtener la info:
http://stackoverflow.com/questions/31310321/python-urllib2-wait-for-page-to-load-to-scrape-data
No se si funciona con urllib (usan urllib2 en el ejemplo)
On 1/27/17, G
Hola amigos.
Estoy scrapeando un sitio web publico con urllib y beautifulsoup4 y hay
unos tab o lenguetas que se llenan a través de javascript. ¿cómo podría
obtener esa información?
este es el link, el href
Votaciones
y no lo puedo abrir con urllib.request.urlopen
alguien sabe cómo?, han tenido