jean beney a écrit :
Concernant la revue des drapeaux inutiles
le travail d'agnes pourrait peut etre être utile
http://w3.u-grenoble3.fr/lebarbe/agnes/
J'ai regardé le site. Malgré un certain flou dans le texte, je crois
comprendre qu'elle obtient bien moins de drapeaux que ce qui existe
actuellement.
Si j'ai bien compris, le dictionnaire qu'elle obtient en générant
automatiquement des affixes est moins compressé que celui déjà existant,
malgré ses erreurs et ses doublons.
Ceci dit, il y a une chose qui n'est pas précisé dans son rapport, c'est
quel programme "munch" elle a utilisé.
Si c'est celui-ci:
http://lingucomponent.openoffice.org/source/browse/lingucomponent/source/spellcheck/myspell/
il génère une liste mal fichue et pleine de redondances pour autant que
je me souvienne; il n'est pas bien adapté au fichier des affixes
français. Je l'avais essayé l'an dernier.
Cela ne m'étonne pas, vu les paramètres qu'elle utilise et vu qu'elle
recherche des préfixes (ou suffixes) communs, alors que la méthode
existante classe sous le même drapeau des formes différentes de préfixes
(de, dé, des) ou des suffixes différents (ais, ant, ...).
Il faudrait connaître les affixes qu'elle a trouvé pour voir si certains
peuvent utilement être ajoutés à ceux existant.
Je suis d'accord.
Il y les préfixes suivants dans le fichier des affixes du dictionnaire
réformé de 1990:
PFX T Y 1
PFX T 0 sur .
PFX C Y 2
PFX C 0 contre [^aàâeèéêiîoôu½]
PFX C 0 contr [aàâeèéêiîoôu½]
Ceux qui ont fait ce dictionnaire ont eux aussi choisi de supprimer les
drapeaux que j'ai enlevés, ainsi que d'autres.
http://wiki.services.openoffice.org/wiki/Dictionaries
de plus, j'ai du mal à comprendre la notion de drapeaux inutiles
Peut-être parce que personne ne parle de drapeaux "inutiles". Olivier a
supprimé des drapeaux inutilisés et moi j'ai repéré les combinaisons
lemme/drapeau qui sont improductives.
Oui, ils sont inutilisés et de surcroît vraiment peu intuitifs à
l'emploi (c'est peut-être pour ça qu'ils ne sont pas utilisés
d'ailleurs). J'ai donc effectivement choisi de ne pas les intégrer dans
mon application.
.........................
J'ai passé en revue les drapeaux qui apparaissent en double. Je suggère
les corrections suivantes :
accastillais/jnlvv accastillais/jnlv + mt?
accastillerai/jnlxx accastillerai/jnlx + mt?
accastiller : garnir un navire de ses structures au-dessus du pont
supérieur.
le "m" n'est donc pas de mise;
le "t" pourrait convenir, si les marins s'adressent à leur navire comme
on peut le faire parfois avec les objets...
Et il me semble que tous les autres drapeaux en double peuvent être
simplement supprimés :
Absolument. Les doublons n'ont aucune utilité.
Une procédure automatique réglera facilement ce problème.
moulais/Rvvc de plus le c fait double emploi avec moulante/F
Il n'est pas certain qu'il faille ôter ce genre de doublon. Je me pose
la question. Si on introduit un champ "morphologie" pour chaque entrée
du dictionnaire, on pourrait avoir plein de doublons du genre:
amoureuse/LMF nomcommun
amoureuse/LMF adjectif
Un correcteur grammatical pourrait avoir besoin de ce champ pour
simplifier son boulot...
médisais/dcvc de plus le d fait double emploi avec le v
médisais/v donne :
médisaient
médisais
médisait
médisant
médisez
médisiez
médisions
médisons
médisais/d
médisaient
médisais
médisait
médisant
médisiez
médisions
médisons
médites
avec/MMQ de plus le Q fait double emploi avec qu'avec
Oui, il y a souvent des entrées qui n'ont pas été effacées malgré leur
reproduction possible avec d'autres entrées à drapeaux.
C'est notamment le cas des verbes commençant par "s'" (élision de se)
qui sont reproduits pas les entrées avec les drapeaux p et q.
Là encore, une procédure réglera le problème.
Olivier
---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]