jean beney a écrit :

Concernant la revue des drapeaux inutiles
le travail d'agnes pourrait peut etre être utile
http://w3.u-grenoble3.fr/lebarbe/agnes/

J'ai regardé le site. Malgré un certain flou dans le texte, je crois comprendre qu'elle obtient bien moins de drapeaux que ce qui existe actuellement.

Si j'ai bien compris, le dictionnaire qu'elle obtient en générant automatiquement des affixes est moins compressé que celui déjà existant, malgré ses erreurs et ses doublons. Ceci dit, il y a une chose qui n'est pas précisé dans son rapport, c'est quel programme "munch" elle a utilisé.
Si c'est celui-ci:
http://lingucomponent.openoffice.org/source/browse/lingucomponent/source/spellcheck/myspell/
il génère une liste mal fichue et pleine de redondances pour autant que je me souvienne; il n'est pas bien adapté au fichier des affixes français. Je l'avais essayé l'an dernier.


Cela ne m'étonne pas, vu les paramètres qu'elle utilise et vu qu'elle recherche des préfixes (ou suffixes) communs, alors que la méthode existante classe sous le même drapeau des formes différentes de préfixes (de, dé, des) ou des suffixes différents (ais, ant, ...). Il faudrait connaître les affixes qu'elle a trouvé pour voir si certains peuvent utilement être ajoutés à ceux existant.

Je suis d'accord.


Il y les préfixes suivants dans le fichier des affixes du dictionnaire réformé de 1990:

PFX T Y 1
PFX T   0          sur        .

PFX C Y 2
PFX C   0          contre     [^aàâeèéêiîoôu½]
PFX C   0          contr      [aàâeèéêiîoôu½]

Ceux qui ont fait ce dictionnaire ont eux aussi choisi de supprimer les drapeaux que j'ai enlevés, ainsi que d'autres.
http://wiki.services.openoffice.org/wiki/Dictionaries


de plus, j'ai du mal à comprendre la notion de drapeaux inutiles

Peut-être parce que personne ne parle de drapeaux "inutiles". Olivier a supprimé des drapeaux inutilisés et moi j'ai repéré les combinaisons lemme/drapeau qui sont improductives.

Oui, ils sont inutilisés et de surcroît vraiment peu intuitifs à l'emploi (c'est peut-être pour ça qu'ils ne sont pas utilisés d'ailleurs). J'ai donc effectivement choisi de ne pas les intégrer dans mon application.


.........................
J'ai passé en revue les drapeaux qui apparaissent en double. Je suggère les corrections suivantes :

accastillais/jnlvv       accastillais/jnlv + mt?
accastillerai/jnlxx      accastillerai/jnlx + mt?

accastiller : garnir un navire de ses structures au-dessus du pont supérieur.
le "m" n'est donc pas de mise;
le "t" pourrait convenir, si les marins s'adressent à leur navire comme on peut le faire parfois avec les objets...


Et il me semble que tous les autres drapeaux en double peuvent être simplement supprimés :

Absolument. Les doublons n'ont aucune utilité.
Une procédure automatique réglera facilement ce problème.


moulais/Rvvc            de plus le c fait double emploi avec moulante/F

Il n'est pas certain qu'il faille ôter ce genre de doublon. Je me pose la question. Si on introduit un champ "morphologie" pour chaque entrée du dictionnaire, on pourrait avoir plein de doublons du genre:
amoureuse/LMF   nomcommun
amoureuse/LMF   adjectif
Un correcteur grammatical pourrait avoir besoin de ce champ pour simplifier son boulot...


médisais/dcvc           de plus le d fait double emploi avec le v

médisais/v donne :
médisaient
médisais
médisait
médisant
médisez
médisiez
médisions
médisons

médisais/d
médisaient
médisais
médisait
médisant
médisiez
médisions
médisons
médites


avec/MMQ               de plus le Q fait double emploi avec qu'avec

Oui, il y a souvent des entrées qui n'ont pas été effacées malgré leur reproduction possible avec d'autres entrées à drapeaux. C'est notamment le cas des verbes commençant par "s'" (élision de se) qui sont reproduits pas les entrées avec les drapeaux p et q.
Là encore, une procédure réglera le problème.



Olivier

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Répondre à