hier einige interessante ergebnisse:
$ find .purple/logs/ -type f | xargs cat | grep -iow
'[uiaeosnrtdy]\+' | sort -u | wc
4059 4059 27829
mit neo sind also 4059 wörter auf der grundreihe tippbar (ohne
sonderzeichen, smileys und dgl. – sonst hätten wir einen noch viel
größeren vorsprung *g*)
$ find .purple/logs/ -type f | xargs cat | grep -iow
'[asdfghjklöä]\+' | sort -u | wc
797 797 5901
mit quertz sind es hingegen nur 797 wörter, dies ich auf der
grundreihe tippen lassen. gut für neo :)
das ganze wurde mit folgender datenbasis vollzogen (1,6 millionen
zeilen sind nicht wenig oO):
$ find .purple/logs/ -type f | xargs cat | wc
1598073 20732705 146264679
klar, da sind jetzt die nicknames und timestamps und so drinnen, also
ist das vl nicht ganz so repräsentativ. zeigt aber trotzdem schön die
überlegenheit von neo :)
meine logs enthalten sowohl englische als auch deutsche chats (wenn
auch die deutschen in der überzahl sind – aber genau für solche fälle
wurde neo entwickelt)
vl lässt sich mit den logs (ordentlich gefiltert: timestamps raus,
nicknames raus, statusupdates raus) noch mehr anfangen.
so, und nun ne gute nacht, daniel :)
--
myFtPhp -- visit http://myftphp.sf.net -- v. 0.4.7 released!