Job : Ph.D. student (UClouvain) : CMesure: reliable and adaptive modeling of 
text readability in French as a foreign language


L'UCLouvain recherche

un chercheur ou une chercheuse pour un doctorat en traitement automatique du 
langage

- bourse de doctorat à temps plein (100%) pour une durée de quatre ans

- pour le Centre de traitement automatique du langage (Cental), de l'Institut 
langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)

- entrée en fonction: 1er septembre 2023 (négociable)

Cette proposition de bourse de doctorat s’intègre dans le cadre d’un projet de 
recherche réalisé par le Centre de traitement automatique du langage (CENTAL, 
https://uclouvain.be/fr/instituts-recherche/ilc/cental), en collaboration avec 
FEI (France Éducation International, 
https://www.france-education-international.fr/).

Le projet visera à développer un modèle d’évaluation automatisé de la 
lisibilité des textes pour le français langue étrangère (FLE). Il s’agira 
d’évaluer comment des algorithmes d’intelligence artificielle poussés 
permettraient de rendre des formules de lisibilité plus personnalisées, 
notamment en prenant en compte le type de lecture pratiquée, le genre du texte 
et la langue maternelle du lecteur. Dans un second temps, le projet visera à 
intégrer cette formule adaptative au sein d’un moteur de recherche pédagogique 
de textes en FLE, dont la pertinence des résultats sera évaluée par des 
professionnels du FLE.

Ce projet bénéficie de plusieurs atouts. D’une part, il est ancré au sein d’un 
laboratoire dans les recherches en lisibilité sont reconnus internationalement. 
D’autre part, il profitera d’un partenariat stratégique avec France Éducation 
Internationale et d’un accès à des textes utilisés pour les examens 
certificatifs du DELF et du DALF, textes calibrés sur l’échelle du cadre 
européen commun de référence pour les langues (CECR). Cela constituera en un 
point de départ pour l’élaboration d’un modèle de lisibilité pour le FLE qui 
soit (1) plus fiable, car entraîné sur des données rigoureusement calibrées, et 
qui permette (2) d’explorer une question fondamentale en lisibilité, mais 
jamais étudiée à notre connaissance : l’impact de la langue maternelle sur les 
modèles, ainsi que celui du genre de texte et du type de lecture.

Au sein de projet, le rôle du doctorant ou de la doctorante engagé consistera à 
mener l’essentiel de la recherche, à savoir (1) développer de nouvelles 
variables de lisibilité aptes à prendre en compte les caractéristiques 
pédagogiques et de genre des textes analysés ; (2) mettre au point un modèle 
machine learning (classique et/ou deep learning) non adaptatif à partir des 
textes du DELF et du DALF ; (3) mettre au point un modèle adaptatif et le 
comparer à sa version non adaptative et (4) intégrer ce modèle de lisibilité au 
sein d’un moteur de recherche adaptatif. Le chercheur ou la chercheuse devra 
également assurer la diffusion des résultats obtenus via des publications 
scientifiques et rédiger une thèse de doctorat. Il ou elle sera amené à 
collaborer étroitement avec les autres membres de l’équipe en vue d’assurer la 
bonne réalisation de ces tâches.

Environment de travail :

Le CENTAL est rattaché à l’Institut Langage & Communication 
(https://uclouvain.be/fr/instituts-recherche/ilc), qui fait partie de 
l’UCLouvain. Cette université est située à Louvain-la-Neuve 
(https://uclouvain.be/fr/sites/louvain-la-neuve), une ville piétonne, agréable 
à vivre et très dynamique. Le projet de recherche sera réalisé sous la 
direction du Pr. Thomas François 
(https://thomasfrancoisucl.wixsite.com/homepage), expert en lisibilité et en 
simplification automatique de la langue. Des missions à Paris (Sèvres) sont 
prévues afin d’assurer une bonne collaboration avec FEI. Cet organisme est 
mondialement reconnu pour son expertise dans le domaine de l’évaluation des 
niveaux de compétence en français langue étrangère (FLE) et est en charge de 
l’organisation des principaux tests de langues en français, à savoir le TCF, le 
DELF, ou le DAFL.

Qualifications et aptitudes requises

Le candidat répondra aux qualifications suivantes :

  *   Être porteur d’un master en Linguistique computationelle, en Traitement 
automatique du langage (TAL), ou en Informatique (option en Intelligence 
artificielle).

  *   Faire montre d’un excellent parcours académique

  *   Disposer de bonnes compétences informatiques :

     *   langages de programmation : Python, R (ou similaire)

     *   la connaissance de scikit-learn, pandas, tensorflow/keras et/ou pytorch

     *   systèmes : Linux de préférence

  *   Bonne connaissance des principaux outils et algorithmes du TAL. La 
connaissance des réseaux de neurones profonds est un plus.

  *   Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance 
de l’anglais (niveau B2 minimum)

  *   Autonomie, curiosité, sens du travail en équipe, capacité d’écoute et 
d’analyse des besoins, réactivité.

Conditions d’engagement :

Cette bourse de doctorat est soumise aux conditions suivantes :

  *   À la date d’engagement, le doctorant doit être titulaire depuis au 
maximum 3 ans* d’un grade académique de master 120 crédits ou d’un grade 
reconnu comme équivalent.

  *   Le montant net de la bourse est d’environ 2 370 euros par mois.

* Le délai maximum fixé ci-dessus est augmenté d’une année par accouchement 
et/ou par adoption.

Dossier de candidature :

Date limite de remise du dossier : 22 juin


Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de 
candidature à Thomas François par mail ([email protected]). Celui-ci 
devra inclure :


1. un curriculum vitae détaillé en français ou anglais reprenant les 
différentes qualifications et aptitudes requises, les détails de votre parcours 
académique (grades, listes de cours), ainsi que les éventuelles publications et 
autres expériences académiques et scientifiques ;


2. une lettre de motivation en français, décrivant votre intérêt pour le poste, 
comment votre profil répond à la description du poste et aux objectifs du 
projet, etc. (maximum 2 pages) ;


3. une lettre de référence en français ou en anglais de la part d’un ou d’une 
de vos professeur(e)s.


Les candidats retenus seront invités à participer à un entretien via 
vidéo-conférence selon des modalités qui leur seront ensuite transmises par 
mail.

Plus d'informations :

Les questions concernant le poste ou la procédure de candidature doivent être 
envoyées par e-mail à Thomas François ([email protected]) avant le 
15 juin.

Pr. Thomas François


Chargé de cours en linguistique appliquée
Faculté de Philosophie, Arts et Lettres
Université catholique de Louvain
Institut Langage et Communication, PLIN, CENTAL et TeaMM
Place Montesquieu, 3 - box L2.06.04 • B-1348 Louvain-la-Neuve • Belgium
Tél. : +32 (0)10 / 47 37 36

_______________________________________________
Corpora mailing list -- [email protected]
https://list.elra.info/mailman3/postorius/lists/corpora.list.elra.info/
To unsubscribe send an email to [email protected]

Reply via email to