*** The English translation follows the three asterisks (*) characters
Bonjour,

Pour info, je continue actuellement à ajouter les règles phonétiques
à eSpeak pour le français. Ce travail bénéficie beaucoup de Cicero TTS
qui fournit déjà des règles de conversion du texte en phonèmes. Elles
sont écrites sous forme d'expression régulières cependant (eSpeak
utilise une autre syntaxe pour les fichiers fr_rules / fr_list) et le
jeu de symboles pour les phonèmes de Cicero (c'est à dire les phonèmes SAMPA 
pour
MBROLA) est légèrement différent du jeu de symboles eSpeak.

Les auteurs de Cicero offre une liste de vérification de 622 mots et
la transcription phonétique associée. Ainsi les régressions sont
mesurées grâce a cette liste.
Actuellement, plus de 88 pour cent de ces mots sont correctement
converti par eSpeak en français. 

Cicero offre aussi une liste de 10000 mots en français et le projet
LLiaphon une liste de 80000 mots.

Les règles de Cicero concernent les mots les plus couramment utilisés
en français, et leur sélection est très pertinente. Comme cet ensemble
de mots varie cependant en fonction du profil utilisateur, à long
terme, nous pourrions peut-être étendre les règles. 

J'espère que les principales règles seront obtenues aujourd'hui.
Nous compléterons ensuite la liste d'exception (fr_list). Elle contient déjà les
info permettant de prononcer les chiffres en français. 

L'écriture des règles et des exceptions est tout a fait accessible en
mode texte.

Comme indiqué par Nath, un autre travail mais plus sur le long terme
sera d'améliorer la prononciation de certains phonèmes, comme le 'r'
par exemple. Cela nécessite d'utiliser speakedit et une interface
graphique.

A+
Gilles

***
Hello,

For info, I continue at the moment to add French phonetic rules to
eSpeak. This work benefits a lot from Cicero TTS which already provides
text to phonemes rules. They are written as regular expressions
though (eSpeak expect another syntax in fr_rules, fr_list), and the
set of symbols for the Cicero phonemes (that is SAMPA phonemes from
MBROLA) is slightly different from the eSpeak symbols.

The Cicero authors offers a checklist of 622 reference words and their
phonetic translation, so that regressions can be measured using this
list.
At the moment, more than 88 per cent of these words are correctly
converted using eSpeak in French.

Besides it, Cicero provides a list of 10000 French words, and the
LLiaphon project a list of 80000 words.

The Cicero rules focus on the most commonly used French words and they
are cleverly selected. As the set of common words may vary according
to the user profile, in the long run, we could perhaps extend these rules.

I hope that the main rules will be written today.
Then we will complete the exception list (fr_list). It already
includes info for speaking numbers in French.

Writing rules and exceptions is a fully accessible work in a text
based environment.

As Nath noticed it, another work (rather in the long run) will be to
improve some phonemes, for example the 'r'. It will require speakedit
which has a graphical interface.

Cheers
Gilles 

-- 
Oralux http://oralux.org
_______________________________________________
Oralux mailing list
[email protected]
http://lists.freearchive.org/mailman/listinfo/oralux

Reply via email to