[motrech] [Fwd: MisterBot développeur]
[Les parties de ce message comportant autre chose que du texte seul on été supprimées] - motrech - http://motrech.free.fr/ frutch - http://www.frutch.org/ - Liens Yahoo! Groupes * Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ * Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des : http://fr.docs.yahoo.com/info/utos.html
Re: [motrech] Commentaires sur Le pire tout Pire
La conclusion de ma présentation est la suivante : - Un grid fournit principalement des ressources calcul - Actuellement les documents webs sont analysés, parsés, traités le plus rapidemment possible Mais le goulot d'étranglement d'un moteur de recherche est bien souvent la bande passante, plus que la puissance de calcul. C'est ce qu'on dit souvent, mais j'ai la vilaine impression que le temps CPU coute bcp plus d'argent que la bande passante et que le doublement de bande passante engendrerait un doublement en besoin matériel pour le traitement de l'indexation. En écrivant cela, j'ai toute conscience que ce n'est pas très sérieux d'avancer ce genre de chose en se fiant à sa simple intuition, mais j'ai l'impresssion d'avoir déjà lu ce genre de point de vue à l'égard de la bande passante. Il faudrait que je retrouve ces articles. - appliquer des traitements d'analyses précis et nombreux (plutot que par exemple une approximation de la langue du document) Je suis curieux... Je ne connais actuellement pas d'autres moyens d'identifier la langue que celles proposées aujourd'hui par exemple dans Nutch: Utilisation des méta-données + analyse statistique du contenu. Si je ne me trompe pas, pour identifier la langue actuellement : - utilisation d'un algorithme - utilisation d'un paramètre de précision - selon la valeur de ce paramètre, la précision grandit parallèlement au temps d'exécution. Me trompe-je ? J'espere que le débat sera bien là et constructif :) Personnellement, je suis impatient d'en lire plus sur le sujet!!! (PS: As-tu jeté un coup d'oeil sur le framework mapred de Nutch? Qu'en penses-tu?) Non, vraiment pas le temps :) Mais tout commentaire m'intéresse sur le sujet ! ;) A+ Jérôme -- http://motrech.free.fr/ http://www.frutch.org/ [Les parties de ce message comportant autre chose que du texte seul on été supprimées] - motrech - http://motrech.free.fr/ frutch - http://www.frutch.org/ - *Liens Yahoo! Groupes* * Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ * Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] mailto:[EMAIL PROTECTED] * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions d'utilisation http://fr.docs.yahoo.com/info/utos.html. - motrech - http://motrech.free.fr/ frutch - http://www.frutch.org/ - Liens Yahoo! Groupes * Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ * Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des : http://fr.docs.yahoo.com/info/utos.html
Re: [motrech] absence de référencement sur http://monsite.fai.fr
Bonjour, Les sites du style site.machin.fr SONT vus et référencés par les moteurs de recherche. (A condition bien sur d'etre pointés par d'autres sites). Google référence par exemple le site mail.fai.fr Cordialement. Christophe Noël Distributed Data Mining CETIC Belgium PELLAT wrote: Bonjour à toutes et à tous, Pourriez-vous m'expliquer pourquoi un site sous une adresse du style http://monsite.fai.fr (pages perso, donc ?) n'est pas vu par les moteurs de recherche ? Cela signifie-t-il que seules les 3 lettres www suivant le http:// permettent à un site d'être visible pour les moteurs ? Par avance, merci de vos explications. Oldfifi - motrech - http://motrech.free.fr/ frutch - http://www.frutch.org/ - Liens Yahoo! Groupes * Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ * Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des : http://fr.docs.yahoo.com/info/utos.html
Re: [motrech] Deepy beta
Salut, Ma réaction à mon collègue sur tes commentaires J'adore le correcteur orthoraphique à la volée (son interface) : ah c'est comme nous, sauf que sur de grands indexs, cela devient très lent... MAIS la réactivité de l'interface est quasiment nulle. C'est lent, c'est très lent, c'est ennuyant... = ah, ils utilisent certainement comme nous l'algorithme de Levenshtein (distance entre mots) que j'ai pluggé sur nutch pour de petits moteurs. Jérôme Charron wrote: Moteur Deepy beta... http://motrech.blogspot.com/2005/05/test-au-plus-profond-de-la-lourdeur.html Jérôme -- http://motrech.free.fr/ http://frutch.free.fr/ [Les parties de ce message comportant autre chose que du texte seul on été supprimées] -- motrech [home] - http://motrech.free.fr/ motrech [liste] - http://fr.groups.yahoo.com/group/motrech motrech [blog] - http://motrech.blogspot.com/ frutch [home] - http://frutch.free.fr/ frutch [wiki] - http://frutch.free.fr/wikini frutch [liste] - http://fr.groups.yahoo.com/group/frutch -- Liens Yahoo! Groupes * Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ * Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des : http://fr.docs.yahoo.com/info/utos.html