Non sans une pointe d'humour, oserais-je ne pas te suggérer "La
Disparition", ouvrage de Georges Pérec.
Le 18/11/2025 à 08:53, Basile Starynkevitch a écrit :
Bonjour la liste
Je recherche un ou plusieurs fichiers textuels dans le domaine public en
français correct dépassant le mégaoctet chacun.
Je songe par exemple aux textes classiques (par exemple "Les misérables" de Victor Hugo,
ou "L'île mystérieuse" de Jules Verne).
Il me faut un texte qui contienne peu de fautes d'orthographes ou de grammaire.
Et dans un format textuel simple (HTML4 serait convenable, ou même du texte
UTF-8)
Il doit respecter les propriétés statistiques du français usuel, en particulier
la lettre la plus fréquente doit bien être le E
(donc le roman https://fr.wikipedia.org/wiki/La_Disparition_(roman) ne convient
pas).
L'usage que j'en ferais est de tester des algorithmes textuels (recherche de
mots, ....)
Librement