Re: Que faig malament amb wget?

2001-10-30 Conversa Xavi Drudis Ferran
El Tue, Oct 30, 2001 at 01:06:42AM +0100, Toni Cuñat deia:
 Simplement crea un arxiu de configuracio el ~HOME/.wgetrc amb la següent
 linea:
 robots = off


Tens raó que el problema és el robots.txt.
Però dir-li al robot que es porti malament no és gaire ben educat.
L'autor de la web no vol que facis servir robots per baixar-te 
les seves pàgines (ves a saber perquè) i l'wget és un robot. 

Doncs la solució és mirar-se la web a mà. 

A més la gent quan no fas cas de les seves preferències et poden 
excloure i negar-se a servir les planes al teu user-agent o 
a la teva IP. 




-- 
Xavi Drudis Ferran
[EMAIL PROTECTED]



Que faig malament amb wget?

2001-10-29 Conversa Ignasi Tura
Hola companys,

vull baixar aquesta pàgina, i anar seguint els enllaços locals per a
també baixar-los, fent servir la següent ordre:

wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A jpg,gif 
-r -l 2 -np -L

Activo la recursió amb -r.
Poso -L perquè no em vagi a baixar coses fora del servidor aquest.
Accepto els jpg, els gif.
Poso dos nivells de profunditat i el --no-parent per anar posant coses en la
 línia de comandaments, de la quantitat de vegades que he provat de baixar 
aquests documents.
Perquè no hi ha manera que em baixi res més que el nausicaa_lecture_1_p1.html 
i el robots.txt, quan el document aquest té uns enllaços ben cucos que porten 
al nausicaa_lecture_1_p2.html i anar seguint.
Si és un error imbècil, podeu aprofitar-vos de la situació acompanyant 
la solució de tot d'insults, i igualment els acceptaré amb alegria, perquè no 
és el primer cop que tinc problemes amb el wget, i tot i haver llegit el 
manual del dret i del revés no hi ha manera.

Faig servir la versió 1.5.3.

Doncs res, prego m'il·lumineu.

Gràcies.

Ignasi
-- 
Debian GNU/Linux-   Un sistema operatiu per a un
món millor.
http://www.debian.org   
An OS for a better world.


_
Do You Yahoo!?
Get your free @yahoo.com address at http://mail.yahoo.com




Re: Que faig malament amb wget?

2001-10-29 Conversa Carles Pina i Estany


Hola


no em facis massa cas, perquè no ho he provat

 wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A 
 jpg,gif -r -l 2 -np -L

 Activo la recursió amb -r.

ok

 Poso -L perquè no em vagi a baixar coses fora del servidor aquest.

ok

 Accepto els jpg, els gif.

i perquè no acceptes també els .html? potser no segueix el link perquè és
un .html? prova-ho i diguen-sho

fins aviat


Carles Pina i Estany | Nick: Pinux / Pine / Teufeus
E-Mail: [EMAIL PROTECTED] / [EMAIL PROTECTED]
http://www.salleURL.edu/~is08139/

   Linux is userfriendly, but is only a bit selective about its friends :-)



Re: Que faig malament amb wget?

2001-10-29 Conversa Toni Cuñat
El 2001.10.29 23:50 Ignasi Tura ha escrit:
 Hola companys,
 
 vull baixar aquesta pàgina, i anar seguint els enllaços locals per a
 també baixar-los, fent servir la següent ordre:
 
 wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A
 jpg,gif -r -l 2 -np -L
 
Simplement crea un arxiu de configuracio el ~HOME/.wgetrc amb la següent
linea:
robots = off

Adeu (açò no va dins de .wgetrc)
Sort.
 Activo la recursió amb -r.
 Poso -L perquè no em vagi a baixar coses fora del servidor aquest.
 Accepto els jpg, els gif.
 Poso dos nivells de profunditat i el --no-parent per anar posant coses en
 la
  línia de comandaments, de la quantitat de vegades que he provat de
 baixar 
 aquests documents.
 Perquè no hi ha manera que em baixi res més que el
 nausicaa_lecture_1_p1.html 
 i el robots.txt, quan el document aquest té uns enllaços ben cucos que
 porten 
 al nausicaa_lecture_1_p2.html i anar seguint.
 Si és un error imbècil, podeu aprofitar-vos de la situació acompanyant 
 la solució de tot d'insults, i igualment els acceptaré amb alegria,
 perquè no 
 és el primer cop que tinc problemes amb el wget, i tot i haver llegit el 
 manual del dret i del revés no hi ha manera.
 
 Faig servir la versió 1.5.3.
 
 Doncs res, prego m'il·lumineu.
 
 Gràcies.
 
 Ignasi
 -- 
 Debian GNU/Linux-   Un sistema operatiu per a un
 món millor.
 http://www.debian.org   
 An OS for a better world.
 
 
 _
 Do You Yahoo!?
 Get your free @yahoo.com address at http://mail.yahoo.com
 
 
 
 -- 
 To UNSUBSCRIBE, email to [EMAIL PROTECTED]
 with a subject of unsubscribe. Trouble? Contact
 [EMAIL PROTECTED]