Thesis Title: "Improvement of French generation for the KANT machine translation system" Degree Title: "Diplôme de Recherche Technologique" (post-)graduate degree Degree awarded to: Eric Crestan Field of Research: "Communication Homme-Machine" (Human Computer Interaction) Institution: Institut Universitaire Professionnalisé (IUP) of the Université d'Avignon, France. This thesis was completed via a 18-month internship conducted on-site at the Center for Machine Translation of Carnegie Mellon University (Pittsburgh, Pennsylvania, USA). Thesis defense date: public defense took place on 10 November 2000 by Eric CRESTAN in Avignon, France. Abstract in English: The Carnegie Mellon University KANT system is a knowledge-based interlingual machine translation system developed to translate English documents into a wide range of languages. It is a high quality machine translation system requiring controlled English sentences as input. First, we give an overview of machine translation. Then we describe the KANT project and the architecture of the system. Third, we present the largest part of our work on improving French generation, including work on gerund translation and examples of lexical selection rules. These rules have been written under a formalism developed at the Center for Machine Translation. This formalism has been conceived in order to achieve the constitution of F-Structures from Interlinguas. Finally, we propose the utilization of a unilingual statistical language model in order to correct erroneous determiners and prepositions in French sentences generated from the KANT system. We illustrate the behavior of the model through experimental results. Résumé en français: Le système KANT est un programme de traduction à base de connaissances. Il est destiné à la traduction de documents techiques rédigés en anglais vers une variété d'autres langues. Son fonctionnement s'appuie sur une représentation universelle intermédiaire dénommé Interlingua. Si ce système de traduction atteint un haut niveau de qualité, ceci est entre autres dû au fait qu'il a été conçu pour traiter des textes sources rédigés en anglais contrôlé. Nous donnons tout d'abord un aperçu du domaine de la traduction automatique. Puis, nous nous intéressons plus particulièrement au projet KANT et détaillons l'architecture du système. Ensuite, nous présentons l'essentiel de notre travail : plusieurs améliorations apportées à la génération du français, dont notamment les travaux effectués sur la traduction des formes -ing anglaises, mais également des exemples de règles de sélection lexicale. Ces règles ont été écrites dans un formalisme développé par l'équipe CMT de CMU en charge d'assurer une transduction en F-structures de phrases représentées selon les formes appropriées de l'Interlingua. Pour finir, nous proposons l'emploi d'un modèle de langage statistique unilingue, destiné à corriger les phrases générées en français par le système KANT lorsqu'elles contiennent des prépositions ou des déterminants erronés. Nous illustrons le comportement de ce modèle au travers de quelques résultats expérimentaux. Thesis committee members: Marc El-Bèze : Directeur de recherche / Thesis Advisor (home institution) Eric Nyberg : Examinateur / Examiner & Co-Advisor (host institution) Paul Sabatier : Rapporteur / Official Reader Eric Gaussier : Rapporteur / Official Reader Henri Meloni : Examinateur / Examiner Jeffrey Allen : Président du jury et Examinateur / Thesis Committee Chairperson and Examiner ******************** Mason Integrated Technologies Ltd (MIT2) P.O. Box 181015 Boston, MA 02118 USA (617) 247-8885 (office & answering machine) (617) 262-8923 (FAX) [EMAIL PROTECTED] (e-mail) Mason Integrated Technologies Ltd Home Page: http://hometown.aol.com/mit2usa/Index2.html -- For MT-List info, see http://www.eamt.org/mt-list.html