Re: [discuss] Le projet Dicollecte
Bonjour Olivier, Olivier R. wrote: Bonjour à tous, Ainsi que me l'a demandé Sophie, voici une petite présentation du nouveau site Dicollecte que j'ai construit ces deux derniers mois. Merci beaucoup pour ta présentation et aussi pour ton travail et ta participation au concours :) Je saute à tes questions : [...] J'en viens maintenant à mes questions: - qui va juger de tout ceci? la communauté d'OOo? SUN? les project leads? C'est la communauté via des membres du CC et de l'ESC avec l'appui des project leads des projets présentés. Le CC a écrit les règles du concours et Sun en est le sponsor pour les ressortissants des pays qui peuvent recevoir de l'argent. - est-il normal que je n'ai reçu aucun message depuis que j'ai envoyé le projet (je l'ai même envoyé deux fois par mesure de sécurité)? Pas de "bien reçu, merci, on vous recontacte". Aucune question. Silence radio absolu. Je crois que le comité s'est laissé un délai de 15 jours. Mais tiens moi au courant. Merci encore pour tout ton travail pour OOo. A bientôt Sophie - To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
RE: [discuss] Le projet Dicollecte
faits, des noms. Dictionnaire biographique, géographique. Dictionnaire des contemporains. DICTIONNAIRE, VOCABULAIRE, GLOSSAIRE, LEXIQUE. Ils signifient en général tout ouvrage où un grand nombre de mots sont rangés suivant un certain ordre, pour les retrouver plus facilement quand on en a besoin ; mais il y a cette différence : 1° que vocabulaire et glossaire ne s'appliquent guère qu'à de purs dictionnaires de mots, au lieu que dictionnaire, en général, comprend non-seulement les dictionnaires de langues, mais encore les dictionnaires historiques, et ceux des sciences et des arts ; 2° que dans un vocabulaire les mots peuvent n'être pas distribués par ordre alphabétique, et peuvent même n'être pas expliqués ou ne l'être qu'en un seul mot, sans raisonnement ; 3° que glossaire ne s'applique guère qu'aux dictionnaires de mots peu connus, barbares ou surannés : le Glossaire de du Cange ; 4° que lexique, qui s'appliquait dans l'antiquité à un dictionnaire de mots rares et de formes difficiles, désigne aujourd'hui surtout un recueil des mots d'un auteur, par exemple le lexique d'Homère, et que, dans les classes, lexique se dit des abrégés des dictionnaires de mots. Diction. DICTIONNAIRE. Ajoutez : 3°Ensemble des mots dont se sert un écrivain. Le dictionnaire de Corneille. Le dictionnaire de Bossuet est très étendu. -Message d'origine- De : [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] fice.org]De la part de Olivier R. Envoyé : jeudi 26 juin 2008 21:07 À : discuss@fr.openoffice.org Objet : [discuss] Le projet Dicollecte Bonjour à tous, Ainsi que me l'a demandé Sophie, voici une petite présentation du nouveau site Dicollecte que j'ai construit ces deux derniers mois. Au dernier moment imaginable, j'ai pu boucler une version afin de la proposer au concours d'innovation de SUN: http://development.openoffice.org/community_innovation_program.html Le principe initial, collecter des mots de la part des utilisateurs, n'a pas changé, mais j'ai tâché d'améliorer l'ensemble de toutes les manières possibles. La raison initiale de la reconstruction du site était son adaptation au nouveau dictionnaire français sur lequel je travaille depuis plus de six mois. Comme ce nouveau dico n'est pas encore terminé et que ce n'est pas le sujet de ce mail, je passe sur ce point. Par rapport à l'ancien site (très rudimentaire et d'une conception grossière), il n'y a presque que de nouvelles fonctionnalités. Voici les principales: # 1. Le site est internationalisable. Il suffit de traduire une série de fichiers, de créer de nouvelles tables dans la base de données et de procéder à quelques réglages pour adapter le site aux dictionnaires étrangers. En guise de démonstration, j'ai uploadé les dictionnaires anglais et allemand. # 2. Modification du thesaurus. Il est possible d'éditer les entrées du thésaurus directement, et pour chaque entrée d'ajouter aisément des catégories de significations ou d'en soustraire, dans selon l'ordre qu'on veut. Pour la démonstration de cette fonctionnalité, mieux vaut aller voir dans le thesaurus anglais qui est bien plus complet et mieux organisé que le thesaurus français. Ce dernier ne propose qu'une seule catégorie de synonymes où tout est mélangé pêle-mêle. Contrairement aux dictionnaires orthographiques, où les modifications passent par un procédé de validation des propositions, l'édition du thesaurus est directe (car il eût été trop complexe de faire autrement à mon humble avis). Cependant, chaque modification est enregistrée dans des fichiers de suivi. Chaque édition d'une entrée bloque l'édition de cette entrée par quiconque d'autre durant un temps déterminé. # 3. Edition des pages personnelles à chaque projet. Chaque administrateur de projet peut éditer à sa guise cinq pages pour y diffuser les informations qu'il désire: - la page Home pour les dernières nouvelles - la page Documentation pour y expliquer ce qu'il désire au sujet des dictionnaires, des affixes, etc. - la page FAQ - la page Download pour y proposer les dictionnaires résultants. - la page Old news ou archives pour vider la page Home des anciennes nouvelles. Cette édition est un peu "brute", car le bouton "Editer cette page" que seuls les admins de projet peuvent voir fait basculer la page en édition HTML directe (seul le contenu des pages est accessible, bien sûr). # 4. Personnalisation des projets. Outre l'édition de certaines pages du site par les admins, il est possible de personnaliser les projets. Je n'ai pas eu le temps d'en faire autant que je le souhaitais sur ce point, mais c'est mieux que rien. a. Création de sous-dictionnaires orthographiques. Chaque projet peut définir un nombre important (c'est codé sur
[discuss] Le projet Dicollecte
Bonjour à tous, Ainsi que me l'a demandé Sophie, voici une petite présentation du nouveau site Dicollecte que j'ai construit ces deux derniers mois. Au dernier moment imaginable, j'ai pu boucler une version afin de la proposer au concours d'innovation de SUN: http://development.openoffice.org/community_innovation_program.html Le principe initial, collecter des mots de la part des utilisateurs, n'a pas changé, mais j'ai tâché d'améliorer l'ensemble de toutes les manières possibles. La raison initiale de la reconstruction du site était son adaptation au nouveau dictionnaire français sur lequel je travaille depuis plus de six mois. Comme ce nouveau dico n'est pas encore terminé et que ce n'est pas le sujet de ce mail, je passe sur ce point. Par rapport à l'ancien site (très rudimentaire et d'une conception grossière), il n'y a presque que de nouvelles fonctionnalités. Voici les principales: # 1. Le site est internationalisable. Il suffit de traduire une série de fichiers, de créer de nouvelles tables dans la base de données et de procéder à quelques réglages pour adapter le site aux dictionnaires étrangers. En guise de démonstration, j'ai uploadé les dictionnaires anglais et allemand. # 2. Modification du thesaurus. Il est possible d'éditer les entrées du thésaurus directement, et pour chaque entrée d'ajouter aisément des catégories de significations ou d'en soustraire, dans selon l'ordre qu'on veut. Pour la démonstration de cette fonctionnalité, mieux vaut aller voir dans le thesaurus anglais qui est bien plus complet et mieux organisé que le thesaurus français. Ce dernier ne propose qu'une seule catégorie de synonymes où tout est mélangé pêle-mêle. Contrairement aux dictionnaires orthographiques, où les modifications passent par un procédé de validation des propositions, l'édition du thesaurus est directe (car il eût été trop complexe de faire autrement à mon humble avis). Cependant, chaque modification est enregistrée dans des fichiers de suivi. Chaque édition d'une entrée bloque l'édition de cette entrée par quiconque d'autre durant un temps déterminé. # 3. Edition des pages personnelles à chaque projet. Chaque administrateur de projet peut éditer à sa guise cinq pages pour y diffuser les informations qu'il désire: - la page Home pour les dernières nouvelles - la page Documentation pour y expliquer ce qu'il désire au sujet des dictionnaires, des affixes, etc. - la page FAQ - la page Download pour y proposer les dictionnaires résultants. - la page Old news ou archives pour vider la page Home des anciennes nouvelles. Cette édition est un peu "brute", car le bouton "Editer cette page" que seuls les admins de projet peuvent voir fait basculer la page en édition HTML directe (seul le contenu des pages est accessible, bien sûr). # 4. Personnalisation des projets. Outre l'édition de certaines pages du site par les admins, il est possible de personnaliser les projets. Je n'ai pas eu le temps d'en faire autant que je le souhaitais sur ce point, mais c'est mieux que rien. a. Création de sous-dictionnaires orthographiques. Chaque projet peut définir un nombre important (c'est codé sur un caractère en UTF-8) de sous-dictionnaires auxquels il est possible d'assigner les entrées du dico. Ce qui permettra de créer des dictionnaires spécialisés. b. Qui peut éditer le thésaurus. Tous les inscrits? ou seulement les administrateurs et les contrôleurs des dictionnaires? C'est au choix de chaque projet. c. Temps de blocage des entrées du thésaurus quand on commence une édition. d. Personnalisation des liens vers les ressources linguistiques externes. Cette personnalisation se fait toutefois uniquement par l'écriture des fichiers à la création du projet. Rien n'est encore prévu pour y accéder depuis le site lui-même. Ensuite, il faudra demander à l'administrateur du site (moi, pour l'instant) d'éditer les fichiers de projet pour changer ces réglages spécifiques. # 5. Déclinaison des lemmes et analyse morphologique des formes fléchies. Si les entrées sont grammaticalement étiquetées ainsi que les règles d'affixation de Hunspell, le site peut afficher la morphologie des formes fléchies. Exemple: http://dicollecte.free.fr/entry.php?prj=fr&id=122977 http://dicollecte.free.fr/entry.php?prj=fr&id=72153 Si vous constatez des erreurs, elles ne sont pas imputables au site mais à l'étiquetage du dictionnaire qui est toujours en bêta. Pour l'instant, seul le dictionnaire français bénéficie de cet avantage puisque c'est le seul, à ma connaissance, dont 82% des entrées sont grammaticalement étiquetées (par mes soins, vous savez donc qui blamer en cas d'erreur) ainsi que la totalité des règles d'affixation. Cet affichage de la morphologie des mots n'est pas hyper-importante en soi, mais permet de vérifier aisément si un drapeau engendre des formes erronées.