Liebe Tastaturbegeisterte,
Ich habe das Analyseskript fertiggeschrieben und möchte meine Resultate
mit euch teilen! Davor kurz der Kontext:
Wieso Ngram-Dauer messen?
Dieses Thema kam durch die Frage auf, ob & wie Punkt und Komma bei der
Berechnung eines neuen Layouts optimiert werden sollten. Wichtig ist
hier hervorzuheben, dass das zwei unterschiedliche und teils unabhängige
Fragen sind!
Frage 1: Sollte man Punkt & Komma optimieren?
Das ist eine eher theoretische Frage: *Denken wir, dass die alten
QWERTZ-Positionen für Punkt & Komma tatsächlich die bestmöglichen sind?*
Gibt es etwas an diesen Positionen, das besonders für Punkt & Komma
zugeschnitten ist?
* *Falls ja,* dann sollte man Punkt & Komma fixieren und vergessen.
* *Falls nein,* dann sollte man Punkt & Komma mitoptimieren. Aber was
gibt es bei deren Optimierung zu bedenken? Hier setzt mein Skript an.
Frage 2: Wie sollte man Punkt & Komma optimieren?
Die grundsätzlich berechtigte Sorge: Es könnte sein, dass Punkt & Komma
den Anfang einer Gedankenpause darstellen. Deshalb könnte es sein, dass
Trigramme, die mit Punkt/Komma beginnen, grundsätzlich nicht (oder nur
selten) schnell getippt werden. Deshalb könnte es überflüssig /
kontraproduktiv sein, sie mitzuoptimieren.
Daher die Frage: Gibt es diese langsamer getippten Gedankenpausen?
Gedankenpausen messen → Ngram-Dauer
Stellen folgende Trigramme Gedankenpausen dar?
(Teilweise wird Shift verwendet, da wir Großbuchstaben erwarten)
* /Punkt→Enter→Shift/
* /Punkt→Leerzeichen→Shift/
* /Komma→Leerzeichen→Shift/
* /Komma→Leerzeichen→Buchstabe/
Diese Gedankenpausen sollte man unter anderem daran erkennen, dass diese
Trigramme langsamer getippt werden. Deshalb habe ich einen Keylogger
geschrieben, mit dem man Trigrammdauer messen kann.
Resultate
Zwei Leute haben mir dazu Daten zukommen lassen, vielen Dank dafür! Ihre
und meine Daten sind hier zu finden:
https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/tree/main/collected_durations_anon
*Gesammelter Plot*:
https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/blob/main/plots/grouped_duration_comparison.png
*Plot, aufgespalten nach Datenspender*:
https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/blob/main/plots/split_duration_comparison.png
Wir sehen im gesammelten Plot:
* Vor allem /Punkt→Enter→Shift/ wird langsamer getippt
* Alle anderen Trigramme werden im Durchschnitt etwa gleich schnell
getippt
Da "J" um einiges mehr Daten gespendet hat als ich ("F") und "U", sind
die gesammelten Resultate etwas in Richtung seines Schreibstils
verzerrt. Deshalb habe ich auch einen nach Datenspender aufgeteilten
Plot generiert.
Im aufgesplitteten Plot sehen wir ein gemischtes Muster:
* Je nach Datenquelle werden
/Punkt→Leerzeichen→Shift, Komma→Leerzeichen→Shift /und
/Komma→Leerzeichen→Kleinbuchstabe /im Durchschnitt etwa gleich
schnell ODER etwas langsamer als /3xBuchstabe/ getippt.
* Teilweise gibt es auch hier Varianz. Bei "U" und "J" wird
/Komma→Leerzeichen→Kleinbuchstabe/ gleich schnell getippt wie
/3xBuchstabe/; nur "F" tippt diese Kombination langsamer als
/3xBuchstabe./
* Der eine starke Kontrast bleibt /Punkt→Enter→Shift/.
Meine subjektive Interpretation:
Würde ich ein Layout optimieren, so würde ich momentan wie folgt vorgehen:
* /Punkt→Leerzeichen→Shift, Komma→Leerzeichen→Shift /und
/Komma→Leerzeichen→Kleinbuchstabe/ sind je nach Benutzer auf
/3xBuchstabe/-Niveau oder etwas langsamer. Hier könnte man im Korpus
die Häufigkeit dieser Trigramme leicht reduzieren ... oder sie
unberührt lassen. Hier habe ich keine starke Meinung, würde aber
eher zu "unberührt lassen" tendieren.
* /Punkt→Enter→Shift/ stellt mMn eine klare Gedankenpause dar. Hier
würde ich zu einer Häufigkeitsreduktion dieser Trigramme im Korpus
tendieren. Ich würde sie jedoch nicht vollständig ausmerzen, um
zumindest eine gewisse Tippflüssigkeit zu erhalten.
o → Die Häufigkeit z.B. halbieren oder sogar vierteln
* 2-Gramme und vor allem 1-Gramme würde ich tendentiell nicht
verändern, da sie eher Tipphäufigkeit und nicht so sehr
Tippflüssigkeit darstellen.
Pointierte Zusammenfassung eines Freundes: "Absätze sind also die wahren
Gedankenpausen"
Das waren vorerst was ich dazu zu sagen habe. Mich würde interessieren,
was ihr euch denkt.
Liebe Grüße,
Florian
On 22/02/2026 11:17, Florian Thaler wrote:
Liebe Leute,
Ich habe bis jetzt gebraucht (ich war eine Weile ziemlich krank),
jetzt konnte ich mich aber endlich dransetzten, ein Analyseskript zu
schreiben! Es ist noch in Arbeit, im Anhang habe aber ich einen
Graphen zur Vorschau angehängt. :)
Bitte darum, dass alle Leute, die Daten gesammelt haben, sie mir zu
schicken! Bitte...
1. Die generierten Files
2. Das verwendete Layout
3. (Falls klar vorhanden) in welchem Kontext hauptsächlich getippt wurde
4. Ob ich die Daten auch auf GitHub veröffentlichen darf
5. Was auch immer sonst noch relevant erscheint.
(Und danke an die Person, die bereits Daten beigesteuert hat!)
Liebe Grüße,
Florian
_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]