Le Fri, May 15, 2026 at 11:09:46AM +0000, Jean-Christophe a écrit :

la transcription de conférences

je serai curieux d'en connaitre plus sur ces outil...

Pour ma part, sur un gros portable Dell au travail (20 cœurs, 32G RAM)
j'ai essayé ça pour transcrire en temps réel des réunions ou des
présentations que je fais.

taskset -c 0-7 /usr/bin/whisper-stream \
  -m ggml-base.en.bin \
  --threads 8 \
  --step 4000 \
  --length 8000 \
  --keep 2000 \
  --keep-context \
  --beam-size 2 \
  --vad-thold 0.15 \
  --no-gpu |
  tee -a "whisper.txt"

https://github.com/ggml-org/whisper.cpp/
https://packages.debian.org/sid/whisper.cpp
https://huggingface.co/ggerganov/whisper.cpp/tree/main

Le résultat est risible, sauf que si on demande à un gros LLM commercial
de le réparer, on a quelque chose d'utilisable quand bien ce n'est pas
fidèle mot à mot.

Je serais intéressé de savoir s'il y a de meilleurs options pour la
transcription en local, et des options possibles pour la correction
d'erreurs du texte en local aussi.

Et bien entendu j'appelle de tous mes vœux (et mes dons si on me montre
où les envoyer) les forces du Libre à créer des modèles dont même les
données d'entraînement sont libres.

Bon week-end,

Charles

(Pour la petite histoire, quand je faisais des tests au bureau ça a
essayé, sans succès, de transcrire la conversation devant la machine à
café à deux pas dans le couloir, mais là je me suis dit… on n'est pas
rendus.)

Répondre à