[motrech] [Fwd: MisterBot développeur]

2006-03-09 Par sujet Christophe Noel



[Les parties de ce message comportant autre chose que du texte seul on été 
supprimées]



-
motrech - http://motrech.free.fr/
frutch  - http://www.frutch.org/
- 
Liens Yahoo! Groupes

* Pour consulter votre groupe en ligne, accédez à :
http://fr.groups.yahoo.com/group/motrech/

* Pour vous désincrire de ce groupe, envoyez un mail à :
[EMAIL PROTECTED]

* L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
http://fr.docs.yahoo.com/info/utos.html
 




Re: [motrech] Commentaires sur Le pire tout Pire

2006-01-19 Par sujet Christophe Noel

 La conclusion de ma présentation est la suivante :
  - Un grid fournit principalement des ressources calcul
  - Actuellement les documents webs sont analysés, parsés, traités le plus
  rapidemment possible

 Mais le goulot d'étranglement d'un moteur de recherche est bien souvent la
 bande passante, plus que la puissance de calcul.

C'est ce qu'on dit souvent, mais j'ai la vilaine impression que le temps 
CPU coute bcp plus d'argent que la bande passante et que le doublement 
de bande passante engendrerait un doublement en besoin matériel pour le 
traitement de l'indexation.
En écrivant cela, j'ai toute conscience que ce n'est pas très sérieux 
d'avancer ce genre de chose en se fiant à sa simple intuition, mais j'ai 
l'impresssion d'avoir déjà lu ce genre de point de vue à l'égard de la 
bande passante. Il faudrait que je retrouve ces articles.

 - appliquer des traitements d'analyses précis et nombreux (plutot que
  par exemple une approximation de la langue du document)

 Je suis curieux... Je ne connais actuellement pas d'autres moyens
 d'identifier la langue que celles proposées aujourd'hui par exemple dans
 Nutch: Utilisation des méta-données + analyse statistique du contenu.

Si je ne me trompe pas, pour identifier la langue actuellement :
- utilisation d'un algorithme
- utilisation d'un paramètre de précision - selon la valeur de ce 
paramètre, la précision grandit parallèlement au temps d'exécution.
Me trompe-je ?


 J'espere que le débat sera bien là et constructif :)

 Personnellement, je suis impatient d'en lire plus sur le sujet!!!
 (PS: As-tu jeté un coup d'oeil sur le framework mapred de Nutch? Qu'en
 penses-tu?)

Non, vraiment pas le temps :) Mais tout commentaire m'intéresse sur le 
sujet ! ;)

 A+

 Jérôme

 --
 http://motrech.free.fr/
 http://www.frutch.org/


 [Les parties de ce message comportant autre chose que du texte seul on 
 été supprimées]



 -
 motrech - http://motrech.free.fr/
 frutch  - http://www.frutch.org/
 -


 
 *Liens Yahoo! Groupes*

 * Pour consulter votre groupe en ligne, accédez à :
   http://fr.groups.yahoo.com/group/motrech/

 * Pour vous désincrire de ce groupe, envoyez un mail à :
   [EMAIL PROTECTED]
   mailto:[EMAIL PROTECTED]

 * L'utilisation de Yahoo! Groupes est soumise à l'acceptation des
   conditions d'utilisation http://fr.docs.yahoo.com/info/utos.html.





-
motrech - http://motrech.free.fr/
frutch  - http://www.frutch.org/
- 
Liens Yahoo! Groupes

* Pour consulter votre groupe en ligne, accédez à :
http://fr.groups.yahoo.com/group/motrech/

* Pour vous désincrire de ce groupe, envoyez un mail à :
[EMAIL PROTECTED]

* L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
http://fr.docs.yahoo.com/info/utos.html
 




Re: [motrech] absence de référencement sur http://monsite.fai.fr

2005-10-18 Par sujet Christophe Noel
Bonjour,

Les sites du style site.machin.fr SONT vus et référencés par les moteurs 
de recherche.
(A condition bien sur d'etre pointés par d'autres sites).

Google référence par exemple le site mail.fai.fr

Cordialement.

Christophe Noël
Distributed Data Mining
CETIC
Belgium

PELLAT wrote:

 Bonjour à toutes et à tous,

 Pourriez-vous m'expliquer pourquoi un site sous une adresse du style
 http://monsite.fai.fr (pages perso, donc ?) n'est pas vu par les
 moteurs de recherche ? Cela signifie-t-il que seules les 3 lettres www
 suivant le http:// permettent à un site d'être visible pour les
 moteurs ?

 Par avance, merci de vos explications.

 Oldfifi






-
motrech - http://motrech.free.fr/
frutch  - http://www.frutch.org/
- 
Liens Yahoo! Groupes

* Pour consulter votre groupe en ligne, accédez à :
http://fr.groups.yahoo.com/group/motrech/

* Pour vous désincrire de ce groupe, envoyez un mail à :
[EMAIL PROTECTED]

* L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
http://fr.docs.yahoo.com/info/utos.html
 






Re: [motrech] Deepy beta

2005-05-13 Par sujet Christophe Noel
Salut,

Ma réaction à mon collègue sur tes commentaires J'adore le correcteur 
orthoraphique à la volée (son interface) :
ah c'est comme nous, sauf que sur de grands indexs, cela devient très 
lent...

MAIS la réactivité de l'interface est quasiment nulle. C'est lent, 
c'est très lent, c'est  ennuyant... = ah, ils utilisent 
certainement comme nous l'algorithme de Levenshtein (distance entre 
mots) que j'ai pluggé sur nutch pour de petits moteurs.



Jérôme Charron wrote:

 Moteur Deepy beta...
 http://motrech.blogspot.com/2005/05/test-au-plus-profond-de-la-lourdeur.html

 Jérôme

 -- 
 http://motrech.free.fr/
 http://frutch.free.fr/


 [Les parties de ce message comportant autre chose que du texte seul on 
 été supprimées]






--
motrech [home]  - http://motrech.free.fr/
motrech [liste] - http://fr.groups.yahoo.com/group/motrech
motrech [blog]  - http://motrech.blogspot.com/
frutch  [home]  - http://frutch.free.fr/
frutch  [wiki]  - http://frutch.free.fr/wikini
frutch  [liste] - http://fr.groups.yahoo.com/group/frutch
-- 
Liens Yahoo! Groupes

* Pour consulter votre groupe en ligne, accédez à :
http://fr.groups.yahoo.com/group/motrech/

* Pour vous désincrire de ce groupe, envoyez un mail à :
[EMAIL PROTECTED]

* L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
http://fr.docs.yahoo.com/info/utos.html