> -----Message d'origine-----
> De : [EMAIL PROTECTED]
> [mailto:[EMAIL PROTECTED]
> De la part de Pierrick Brihaye
> Envoyé : mardi 13 septembre 2005 09:28
>
> Il y a bien longtemps, Emmanuel avait donné une piste :
> http://lists.gnu.org/archive/html/sdx-users/2004-03/msg00006.html
>
> On pourrait aussi compter sur des corpus comme Wordnet, mais
> l'étiquettage manuel est encore sans doute ce qui se fait de mieux :-)

Ah, LSA... mais c'était surtout pour catégoriser automatiquement
des documents; pour la désambiguïsation sémantique les procédés
automatiques ne sont apparemment pas encore très opérationnels
(les taux de succès ne dépasseraient pas 60-80%, selon la langue,
le corpus et sa taille).

Un article de Jean Véronis faisait le point sur l'état de l'art:
        http://acl.ldc.upenn.edu/J/J98/J98-1001.pdf
Écrit en 1998, ça reste un bon point de départ...

Pour qui s'intéresse aux mots (et aux moteurs de recherche),
ne pas manquer le blog du même: http://aixtal.blogspot.com/

Cdt,
EB




_______________________________________________
sdx-users mailing list
sdx-users@nongnu.org
http://lists.nongnu.org/mailman/listinfo/sdx-users

Répondre à