hier einige interessante ergebnisse:

    $ find .purple/logs/ -type f | xargs cat | grep -iow
'[uiaeosnrtdy]\+' | sort -u | wc
       4059    4059   27829

mit neo sind also 4059 wörter auf der grundreihe tippbar (ohne
sonderzeichen, smileys und dgl. – sonst hätten wir einen noch viel
größeren vorsprung *g*)

    $ find .purple/logs/ -type f | xargs cat | grep -iow
'[asdfghjklöä]\+' | sort -u | wc
        797     797    5901

mit quertz sind es hingegen nur 797 wörter, dies ich auf der
grundreihe tippen lassen. gut für neo :)

das ganze wurde mit folgender datenbasis vollzogen (1,6 millionen
zeilen sind nicht wenig oO):

    $ find .purple/logs/ -type f | xargs cat | wc
    1598073 20732705 146264679

klar, da sind jetzt die nicknames und timestamps und so drinnen, also
ist das vl nicht ganz so repräsentativ. zeigt aber trotzdem schön die
überlegenheit von neo :)
meine logs enthalten sowohl englische als auch deutsche chats (wenn
auch die deutschen in der überzahl sind – aber genau für solche fälle
wurde neo entwickelt)

vl lässt sich mit den logs (ordentlich gefiltert: timestamps raus,
nicknames raus, statusupdates raus) noch mehr anfangen.

so, und nun ne gute nacht, daniel :)


-- 
myFtPhp -- visit http://myftphp.sf.net -- v. 0.4.7 released!

Antwort per Email an