El Tue, Oct 30, 2001 at 01:06:42AM +0100, Toni Cuñat deia:
Simplement crea un arxiu de configuracio el ~HOME/.wgetrc amb la següent
linea:
robots = off
Tens raó que el problema és el robots.txt.
Però dir-li al robot que es porti malament no és gaire ben educat.
L'autor de la web no vol que
Hola
no em facis massa cas, perquè no ho he provat
wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A
jpg,gif -r -l 2 -np -L
Activo la recursió amb -r.
ok
Poso -L perquè no em vagi a baixar coses fora del servidor aquest.
ok
Accepto els jpg, els gif.
i perquè
El 2001.10.29 23:50 Ignasi Tura ha escrit:
Hola companys,
vull baixar aquesta pàgina, i anar seguint els enllaços locals per a
també baixar-los, fent servir la següent ordre:
wget http://utd500.utdallas.edu/~hairston/nausicaa_lecture_1_p1.html -A
jpg,gif -r -l 2 -np -L
Simplement crea
3 matches
Mail list logo