Re: Que faig malament amb wget?
El Tue, Oct 30, 2001 at 01:06:42AM +0100, Toni Cuñat deia: Simplement crea un arxiu de configuracio el ~HOME/.wgetrc amb la següent linea: robots = off Tens raó que el problema és el robots.txt. Però dir-li al robot que es porti malament no és gaire ben educat. L'autor de la web no vol que facis servir robots per baixar-te les seves pàgines (ves a saber perquè) i l'wget és un robot. Doncs la solució és mirar-se la web a mà. A més la gent quan no fas cas de les seves preferències et poden excloure i negar-se a servir les planes al teu user-agent o a la teva IP. -- Xavi Drudis Ferran [EMAIL PROTECTED]
Que faig malament amb wget?
Hola companys, vull baixar aquesta pàgina, i anar seguint els enllaços locals per a també baixar-los, fent servir la següent ordre: wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A jpg,gif -r -l 2 -np -L Activo la recursió amb -r. Poso -L perquè no em vagi a baixar coses fora del servidor aquest. Accepto els jpg, els gif. Poso dos nivells de profunditat i el --no-parent per anar posant coses en la línia de comandaments, de la quantitat de vegades que he provat de baixar aquests documents. Perquè no hi ha manera que em baixi res més que el nausicaa_lecture_1_p1.html i el robots.txt, quan el document aquest té uns enllaços ben cucos que porten al nausicaa_lecture_1_p2.html i anar seguint. Si és un error imbècil, podeu aprofitar-vos de la situació acompanyant la solució de tot d'insults, i igualment els acceptaré amb alegria, perquè no és el primer cop que tinc problemes amb el wget, i tot i haver llegit el manual del dret i del revés no hi ha manera. Faig servir la versió 1.5.3. Doncs res, prego m'il·lumineu. Gràcies. Ignasi -- Debian GNU/Linux- Un sistema operatiu per a un món millor. http://www.debian.org An OS for a better world. _ Do You Yahoo!? Get your free @yahoo.com address at http://mail.yahoo.com
Re: Que faig malament amb wget?
Hola no em facis massa cas, perquè no ho he provat wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A jpg,gif -r -l 2 -np -L Activo la recursió amb -r. ok Poso -L perquè no em vagi a baixar coses fora del servidor aquest. ok Accepto els jpg, els gif. i perquè no acceptes també els .html? potser no segueix el link perquè és un .html? prova-ho i diguen-sho fins aviat Carles Pina i Estany | Nick: Pinux / Pine / Teufeus E-Mail: [EMAIL PROTECTED] / [EMAIL PROTECTED] http://www.salleURL.edu/~is08139/ Linux is userfriendly, but is only a bit selective about its friends :-)
Re: Que faig malament amb wget?
El 2001.10.29 23:50 Ignasi Tura ha escrit: Hola companys, vull baixar aquesta pàgina, i anar seguint els enllaços locals per a també baixar-los, fent servir la següent ordre: wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A jpg,gif -r -l 2 -np -L Simplement crea un arxiu de configuracio el ~HOME/.wgetrc amb la següent linea: robots = off Adeu (açò no va dins de .wgetrc) Sort. Activo la recursió amb -r. Poso -L perquè no em vagi a baixar coses fora del servidor aquest. Accepto els jpg, els gif. Poso dos nivells de profunditat i el --no-parent per anar posant coses en la línia de comandaments, de la quantitat de vegades que he provat de baixar aquests documents. Perquè no hi ha manera que em baixi res més que el nausicaa_lecture_1_p1.html i el robots.txt, quan el document aquest té uns enllaços ben cucos que porten al nausicaa_lecture_1_p2.html i anar seguint. Si és un error imbècil, podeu aprofitar-vos de la situació acompanyant la solució de tot d'insults, i igualment els acceptaré amb alegria, perquè no és el primer cop que tinc problemes amb el wget, i tot i haver llegit el manual del dret i del revés no hi ha manera. Faig servir la versió 1.5.3. Doncs res, prego m'il·lumineu. Gràcies. Ignasi -- Debian GNU/Linux- Un sistema operatiu per a un món millor. http://www.debian.org An OS for a better world. _ Do You Yahoo!? Get your free @yahoo.com address at http://mail.yahoo.com -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]