Bonjour la liste Je recherche un ou plusieurs fichiers textuels dans le domaine public en français correct dépassant le mégaoctet chacun.
Je songe par exemple aux textes classiques (par exemple "Les misérables" de Victor Hugo, ou "L'île mystérieuse" de Jules Verne). Il me faut un texte qui contienne peu de fautes d'orthographes ou de grammaire. Et dans un format textuel simple (HTML4 serait convenable, ou même du texte UTF-8) Il doit respecter les propriétés statistiques du français usuel, en particulier la lettre la plus fréquente doit bien être le E (donc le roman https://fr.wikipedia.org/wiki/La_Disparition_(roman) ne convient pas). L'usage que j'en ferais est de tester des algorithmes textuels (recherche de mots, ....) Librement -- Basile STARYNKEVITCH basile AT starynkevitch DOT net 8 rue de la Faïencerie http://starynkevitch.net/Basile/ 92340 Bourg-la-Reine https://github.com/bstarynk France https://github.com/RefPerSys/RefPerSys https://orcid.org/0000-0003-0908-5250

