-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Bonjour le peuple,

J'imagine que le fonctionne d'un moteur de recherche tel que Google est
du style crawler. Il scan en permanence le web et index les pages.
L'attribution du ranking est li� aux metatag keyword ainsi qu'au contenu
des pages. Je pense bien qu'il fait �galement le lien entre ces m�mes
keywords et le contenu de la page.

Fort bien. Mais comment s'y prend-t-il rellement? J'imagine qu'il choppe
la page index du site www.domaine.com. Et ensuite? Est-ce qu'il suit les
lien interne au site contenu dans cette page? Est-ce qu'il agit du style
aspirateur ou il pompe toutes les pages physiques sur le site?
D'ailleurs, comment peut-il savoir quelles sont les pages qui existent?

Tout cela, pour en venir � une question sur les pages dynamiques. Soit
un site avec une page index.php. Cette page peut prendre comme argument
id=<id> o� id repr�sente l'identifiant d'une page � compos�e
dynamiquement. Est-ce que mon crawler est capable d'indexer ces pages
l�? IMHO, je ne pense pas. Mais l'avis des experts sur cette liste ne
pourra que m'�clairer d'avantage.

Bonne apr�s-midi � tous et merci,
Fabian
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.3 (MingW32)
Comment: Using GnuPG with Thunderbird - http://enigmail.mozdev.org

iD8DBQFAK4Ge3Qzx239StfYRAlxGAJwMfVD0tcZX9uzluYedIeKIlwpqBQCfZs60
EjdHaMpJt4NxqYAtIBZTOfs=
=p7Wc
-----END PGP SIGNATURE-----
--
The information contained in this electronic message may be legally
privileged and confidential under applicable law, and is intended only for
the use of the individual or entity named above. If the recipient of this
message is not the above-named intended recipient, you are hereby notified
that any dissemination, copy or disclosure of this communication is strictly
prohibited. If you have received this communication in error, please notify
Keyware, +32 2 526 16 16 and purge the communication immediately without
making any copy or distribution.

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/[EMAIL PROTECTED]
IRC: chat.unixtech.be:6667 - #unixtech

Répondre à