> -----Message d'origine----- > De : [EMAIL PROTECTED] > [mailto:[EMAIL PROTECTED] > De la part de Pierrick Brihaye > Envoyé : mardi 13 septembre 2005 09:28 > > Il y a bien longtemps, Emmanuel avait donné une piste : > http://lists.gnu.org/archive/html/sdx-users/2004-03/msg00006.html > > On pourrait aussi compter sur des corpus comme Wordnet, mais > l'étiquettage manuel est encore sans doute ce qui se fait de mieux :-)
Ah, LSA... mais c'était surtout pour catégoriser automatiquement des documents; pour la désambiguïsation sémantique les procédés automatiques ne sont apparemment pas encore très opérationnels (les taux de succès ne dépasseraient pas 60-80%, selon la langue, le corpus et sa taille). Un article de Jean Véronis faisait le point sur l'état de l'art: http://acl.ldc.upenn.edu/J/J98/J98-1001.pdf Écrit en 1998, ça reste un bon point de départ... Pour qui s'intéresse aux mots (et aux moteurs de recherche), ne pas manquer le blog du même: http://aixtal.blogspot.com/ Cdt, EB _______________________________________________ sdx-users mailing list sdx-users@nongnu.org http://lists.nongnu.org/mailman/listinfo/sdx-users