Bonjour la liste

Je recherche un ou plusieurs fichiers textuels dans le domaine public en 
français correct dépassant le mégaoctet chacun.

Je songe par exemple aux textes classiques (par exemple "Les misérables" de 
Victor Hugo, ou "L'île mystérieuse" de Jules Verne).

Il me faut un texte qui contienne peu de fautes d'orthographes ou de grammaire. 
Et dans un format textuel simple (HTML4 serait convenable, ou même du texte 
UTF-8)

Il doit respecter les propriétés statistiques du français usuel, en particulier 
la lettre la plus fréquente doit bien être le E
(donc le roman https://fr.wikipedia.org/wiki/La_Disparition_(roman) ne convient 
pas).

L'usage que j'en ferais est de tester des algorithmes textuels (recherche de 
mots, ....)

Librement

-- 

Basile STARYNKEVITCH                    basile AT starynkevitch DOT net
8 rue de la Faïencerie                       http://starynkevitch.net/Basile/  
92340 Bourg-la-Reine                         https://github.com/bstarynk
France                                https://github.com/RefPerSys/RefPerSys
                  https://orcid.org/0000-0003-0908-5250

Répondre à