Aurelien a �crit, lundi 7 f�vrier 2005, � 13:57 :
> > Je ne comprends pas tr�s bien ce que tu veux pour 3), visiter le lien
> > interactivement, ou r�cup�rer le contenu ?
>
> Visiter le lien. Le contenu est plut�t pauvre, et ne m'int�resse pas,
> mais par contre, je dois visiter une page r�guli�rement.
Bon, juste faire semblant de cliquer sur la page, alors ...
> Je vais essayer ton truc, je n'ai pas tout compris au code, mais je vais
> diss�quer un peu tout �a.
$ lynx -dump - <url.txt | awk '
0,/R�f�rences/{next} # saute tout le contenu, pour voir les liens,
$1 ~ /^[0-9]+\.$/ && $2 ~ /^http:/ && NF==2{ # v�rifie la ligne ...
u[$1]=$2;n++} # ... et copie dans un hachage u[n�.] = lien.
END{print u[int(++n*rand())"."]} # Fini, tire au sort le lien du jour.
' | xargs wget -O /dev/null # R�cup�re le contenu du lien sans le lire.
Il faut peut-�tre cliquer sur certains liens(*) seulement, fais alors un
test plus pr�cis sur $2 ; les options HTTP de wget peuvent aussi servir.
(* �viter une image iso, par exemple :).
--
Jacques L'helgoualc'h
--
Pensez � lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Pensez � rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]