Job : Ph.D. student (UClouvain ) : iRead4skills : Intelligent Reading 
Improvement System for Fundamental and Transversal Skills Development

L'UCLouvain recherche

un chercheur ou une chercheuse pour un doctorat en traitement automatique du 
langage

- bourse de doctorat à temps plein (100%) pour une durée de deux ans

- pour le Centre de traitement automatique du langage (CENTAL), de l'Institut 
langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)

- entrée en fonction: 1er mars 2024 (négociable)

Cette proposition de bourse de doctorat s’intègre dans le cadre du projet 
Européen iRead4Skills - Système intelligent d’amélioration de la lecture pour 
le développement des compétences fondamentales et transversales 
(https://iread4skills.com/fr/). Il s’agit d’un projet de recherche et 
d’innovation financé par la Commission européenne : 
HORIZON-CL2-2022-TRANSFORMATIONS-01-07, réalisé en collaboration avec 8 
partenaires disséminés en Espagne, au Portugal et en Belgique. Le chercheur ou 
la chercheuse recruté sera intégré dans l’équipe du Centre de traitement 
automatique du langage (CENTAL, 
https://uclouvain.be/fr/instituts-recherche/ilc/cental)<https://uclouvain.be/fr/instituts-recherche/ilc/cental)%C3%A0>
 à Louvain-la-Neuve (Belgique).

Le projet iRead4Skills vise àpromouvoir le développement des compétences en 
lecture chez des adultes faibles lecteurs à travers un système intelligent 
innovant qui évalue la complexité des textes et suggère des lectures adaptées 
au niveau de l’utilisateur. Le système pourra également être utilisé par les 
formateurs pour la sélection ou l’adaptation de textes d’un niveau de 
complexité approprié pour leurs étudiants. Enfin, via la production d’un 
diagnostic précis sur les lieux de difficulté des textes, le système pourra 
servir pour l’assistance à la simplification des textes. Le projet se situe 
donc à l’intersection entre les domaines de la lisibilité, de la simplification 
automatique de textes et de l’enseignement de la lecture à des faibles 
lecteurs. Un calendrier des objectifs du projet est disponible sur le site 
(https://iread4skills.com/fr/activites/#calendrier-projet).


Ce projet bénéficie de plusieurs atouts. D’une part, il est ancré au sein d’un 
laboratoire dont les recherches en lisibilité et en simplification automatique 
de textes sont reconnues internationalement. D’autre part, il s’inscrit dans un 
solide consortium regroupant des experts représentatifs des différentes 
disciplines nécessaires à la bonne réalisation du projet.

Au sein de projet, le rôle du doctorant ou de la doctorante engagé(e) 
consistera à mener la partie des recherches qui concerne surtout le 
développement des outils de lisibilité, à savoir (1) développer de nouvelles 
métriques de lisibilité aptes à prendre en compte les caractéristiques 
pédagogiques spécifiques au public des faibles lecteurs et illettrés ; (2) 
mettre au point un modèle machine learning (classique et/ou deep learning) sur 
la base d’un corpus de textes dont la difficulté globale et de certains 
éléments textuels aura été annotés par des professeurs et des faibles lecteurs. 
La quantité de données étant relativement limitée, la personne engagée sera 
aussi amenée à explorer des pistes basées sur les larges modèles de langue et 
le few-shot. Ensuite, (3) sur la base de cette annotation, il s’agira de 
participer au développement de l’outil diagnostic permettant d’identifier les 
segments difficiles à lire dans un texte et (4) d’intégrer ce modèle de 
lisibilité au sein d’un prototype disponible sur un site web. Le chercheur ou 
la chercheuse devra également assurer la diffusion des résultats obtenus via 
des publications scientifiques et rédiger une thèse de doctorat. Il ou elle 
sera amené à collaborer étroitement avec les autres membres de l’équipe en vue 
d’assurer la bonne réalisation de ces tâches. Quelques missions sont aussi 
prévues dans les universités partenaires, afin d’assurer une bonne 
collaboration au sein du consortium. Un budget est également prévu pour des 
déplacements en conférence pour les publications scientifiques en lien avec le 
projet.

Environment de travail

Le CENTAL est rattaché à l’Institut Langage & Communication 
(https://uclouvain.be/fr/instituts-recherche/ilc), qui fait partie de 
l’UCLouvain. Cette université est située à Louvain-la-Neuve 
(https://uclouvain.be/fr/sites/louvain-la-neuve), une ville piétonne, agréable 
à vivre et très dynamique. Le projet de recherche sera réalisé sous la 
direction du Pr. Thomas François (https://cental.uclouvain.be/team/tfrancois/), 
expert en lisibilité et en simplification automatique de la langue.

Qualifications et aptitudes requises

Le candidat répondra aux qualifications suivantes :

  *   Être porteur d’un master en Linguistique computationelle, en Traitement 
automatique du langage (TAL), ou en Informatique (option en Intelligence 
artificielle).

  *   Faire montre d’un excellent parcours académique

  *   Disposer de bonnes compétences informatiques :

     *   langages de programmation : Python, R (ou similaire)

     *   la connaissance de scikit-learn, pandas, tensorflow/keras et/ou pytorch

     *   systèmes : Linux de préférence

  *   Bonne connaissance des principaux outils et algorithmes du TAL. La 
connaissance des réseaux de neurones profonds est un plus.

  *   Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance 
de l’anglais (niveau B2 minimum)

  *   Une expérience pédagogique dans le domaine du français langue étrangère 
ou de l’alphabétisation est un plus.

  *   Autonomie, curiosité, sens du travail en équipe, capacité d’écoute et 
d’analyse des besoins, réactivité.

Conditions d’engagement :

Cette bourse de doctorat est soumise aux conditions suivantes :

  *   À la date d’engagement, le doctorant doit être titulaire depuis au 
maximum 3 ans* d’un grade académique de master 120 crédits ou d’un grade 
reconnu comme équivalent.

  *   Le montant net de la bourse est d’environ 2 370 euros par mois.

  *   Le doctorant devra se domicilier en Belgique pour des raisons légales.

Important : le financement actuel est prévu pour 2 ans et devra être complété 
afin de permettre l’achèvement de la thèse, prévue sur 4 années. Pour ce faire, 
le chercheur sera amené à candidater à des financements en vue de compléter 
cette bourse et sera soutenu par le laboratoire dans cette optique.

* Le délai maximum fixé ci-dessus est augmenté d’une année par accouchement 
et/ou par adoption.

Dossier de candidature :

Date limite de remise du dossier : 20 février


Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de 
candidature à Thomas François par mail 
([email protected]<mailto:[email protected]>). Celui-ci 
devra inclure :


1. un curriculum vitae détaillé en français ou anglais reprenant les 
différentes qualifications et aptitudes requises, les détails de votre parcours 
académique (grades, listes de cours), ainsi que les éventuelles publications et 
autres expériences académiques et scientifiques ;


2. une lettre de motivation en français, décrivant votre intérêt pour le poste, 
comment votre profil répond à la description du poste et aux objectifs du 
projet, etc. (maximum 2 pages) ;


3. une lettre de référence en français ou en anglais de la part d’un ou d’une 
de vos professeur(e)s.


Les candidats retenus seront invités à participer à un entretien via 
vidéo-conférence selon des modalités qui leur seront ensuite transmises par 
mail.

Plus d'informations :

Les questions concernant le poste ou la procédure de candidature doivent être 
envoyées par e-mail à Thomas François 
([email protected]<mailto:[email protected]>) avant le 20 
février.

Thomas François

Chargé de cours en linguistique appliquée
Faculté de Philosophie, Arts et Lettres
Université catholique de Louvain
Institut Langage et Communication, PLIN, CENTAL et TeaMM
Place Montesquieu, 3 - box L2.06.04 • B-1348 Louvain-la-Neuve • Belgium
Tél. : +32 (0)10 / 47 37 36

_______________________________________________
Corpora mailing list -- [email protected]
https://list.elra.info/mailman3/postorius/lists/corpora.list.elra.info/
To unsubscribe send an email to [email protected]

Reply via email to