Bonjour, Préambule : je ne suis affilié en aucune manière avec l’auteur du logiciel, Alberto Pettarin, ici en copie par politesse. Je lui enverrai la traduction en anglais par ailleurs.
Par sérendipité j’ai découvert Aenas, un logiciel libre de marquage temporel qui permet de combiner une paire « fichier son + transcription brute » en un fichier de sous-titre synchronisé. URL https://www.readbeyond.it/aeneas/ Ce qui réduit nettement le coût de la transcription en terme de temps passé, quand on la réalise soi-même. Alberto Pettarin, auteur du lecteur d’audiolivres ePub Menestrello, l’a développé pour pouvoir marquer rapidement les segments de texte en synchronisation avec les fichiers MP3 embarqués qui leur correspondent (avec le langage SMIL du W3C). J’utilise Menestrello en formation accessibilité pour démontrer rapidement comment les personnes dyslexiques utilisent le prononcé audio et le surlignement du texte, synchronisés, pour faciliter leur lecture. D’où le rebond dû à ma curiosité… voir depuis la position 35 secondes et suivantes dans la vidéo de démonstration (avec sous-titres mais sans audiodescription) : https://www.youtube.com/watch?v=KKdhmVrXCC4 Le principe d’Aenas est de générer la synthèse vocale du texte et d’extraire les formes d’onde du prononcé réel et du prononcé synthétique. Puis d’aligner ces deux formes d’onde. C’est tout bête mais encore fallait-il y penser ! C’est extrêmement rapide : quelques secondes pour la vidéo de 10 minutes avec laquelle je l’ai testé, en français. Et à ma grande honte souvent plus pertinent que ce que j’ai pu produire antérieurement manuellement sur la même vidéo… en plus d’une heure. :-/ installation : pour Linux : sudo pip install aeneas ou Pour Windows : https://github.com/sillsdev/aeneas-installer/releases pour Windows exemple de commande sous Linux : python -m aeneas.tools.execute_task test.opus test.txt "task_language=fra|os_task_file_format=srt|is_text_type=plain" test.srt Espérant avoir avec cette information un tout petit peu levé un frein à la généralisation de la création de sous-titres, à ma modeste échelle, Bien cordialement, Erwan Erwan le Gall Chef de projet applications, expert accessibilité, expert Afnor & ISO Direction Numérique pour l'Éducation Ministère de l’Éducation nationale, de l'Enseignement supérieur et de la Recherche Pièce 120 bis — Bât. A 107, rue de Grenelle - 75 007 Paris - tel. : 01.55.55.98.77 / 06.24.45.84.69 (mercredi) [ merci de me placer en (co)destinataire principal en cas de demande d’action ] Information : Ce message et toutes les pièces jointes (ci-après le « message ») sont confidentiels et établis à l’intention exclusive de ses destinataires. Toute utilisation de ce message non conforme à sa destination, toute diffusion ou toute publication, totale ou partielle, ne peut être fait qu’avec l’autorisation expresse de l’émetteur. Si vous recevez ce message par erreur, merci de le détruire sans en conserver de copie et d’en avertir immédiatement l’émetteur. Internet ne permettant pas de garantir l’intégrité de ce message, la responsabilité de l’émetteur ne peut être engagée s’il a été modifié, altéré, déformé ou falsifié, s’il n’a pas été signé électroniquement. « L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes. » Michael R. Fellows, Ian Parberry Computing Research News
_______________________________________________ liste_gta mailing list liste_gta@list.accessiweb.org http://list.accessiweb.org/mailman/listinfo/liste_gta_list.accessiweb.org