Попытался скачать данные с connect . data . com с помощью Grab.
На главной странице ввода пароля все отрабатывает успешно - я получаю ответ
с домашней страницей, где видно, что пользователь зашел.
Но при попытке скачать любую другую страницу, с полученными при запросе
кукисами, получаю ответ, что сессия устарела.
На странице, получаемой после авторизации есть много javascript скриптов,
которые выставляют кукисы по своему алгоритму и к тому же выполняют
дополнительные GET и POST запросы.
Посмотрев на все это, я понял, что чтобы воспроизвести логику javascript
нужно потратить несколько дней.
Намного легче на мой взгляд зайти на сайт с помощью selenium и сразу
получить работающие сессии без ковыряния в javascript.
1. действительно ли selenium намного ускоряет разработку грабера? нет ли
других способов быстро воспроизвести поведение javascript в grab запросах?
2. как использовать selenium с grab? пример с
http://grab.readthedocs.org/ru/latest/grab/transport.html выдает ошибку:
from grab import GrabSelenium
g = GrabSelenium()g.go('http://ixbt.com')print g.xpath_text('//title')
выдает ошибку:
from grab import GrabSelenium
ImportError: cannot import name GrabSelenium
--
You received this message because you are subscribed to the Google Groups
"PyInstaller" group.
To unsubscribe from this group and stop receiving emails from it, send an email
to [email protected].
To post to this group, send email to [email protected].
Visit this group at http://groups.google.com/group/pyinstaller.
For more options, visit https://groups.google.com/d/optout.