Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden Rein Wolf-Heider
Hallo MarkuB,

inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen Texte 
buchstabenweise eingegeben werden, sondern mit einer Steno-Tastatur.
 
Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem einzigen 
Buchstaben und dem Abstand gekürzt und viele weniger häufige Wörter mit zwei 
Buchstaben. Für die Flexionen werden besondere Kodes vorgesehen, die sich 
leicht greifen lassen und nicht die Buchstaben der Wortstämme verwenden. 

Das Programm läuft auf einem Scheckkartencomputer, den man zwischen Tastatur 
und PC einfügt, und der die eingegebenen Kürzungen in Klartext übersetzt. Das 
Ziel ist eine beträchtliche Erhöhung des Schreibtempos. Dies lässt sich nur 
erreichen, wenn man viel weniger Tasten drücken muss, als nachher Buchstaben 
auf dem Bildschirm erscheinen. 

Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der Buchstabe 
d in Texten recht häufig vor. Am häufigsten kommt er bei den Artikeln der, die, 
das, des, dem, den und der Konjunktionen und vor. Diese sieben Wörter werden 
jedoch mit einem anderen Buchstaben (nicht mit d) und dem Abstand gekürzt. 
Damit verliert das d erheblich an Häufigkeit und kann an einer weniger 
griffgünstigen Stelle des Tastenfeldes untergebracht werden.

Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht gefunden. Ich 
will sie anhand der Häufigkeitsliste des Instituts für Deutsche Sprache in 
Mannheim ermitteln (320 000 Wörter mit Häufigkeitsangaben).

Freundliche Grüße aus Pforzheim
Wolf-Heider Rein
whr...@t-online.de

Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden Arne Babenhauserheide

MarkuB writes:

> Wolf-Heider Rein  t-online.de> writes:
>> Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die
> tausend (?) häufigsten
>> Wörter einer Sprache.

Meine Erfahrung ist, dass selbst ein unschöner Übergang pro Seite
deutlich spürbar ist. Deswegen vermute ich, dass tausend Wörter nicht
reichen. Zumindest bei Bigrammen ist der Unterschied zwischen 3000
Bigrammen und allen Bigrammen soweit ich mich erinnere im
Prozentbereich, und damit recht groß.

Eine höherer Gewichtung von Übergängen innerhalb von Silben als von
denen an Silbengrenzen dürfte trotzdem sinnvoll sein. Bisher verwende
ich dafür nur als Proxy welche Silben in Stenographie gekürzt werden
(weil das die häufigsten sind).

>> Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere
> die Buchstabenfolgen
>> beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese
> Silben sind meistens unbetont,
>> und sollten sich mit flotten Bewegungen anfügen lassen.
>>
>
> Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was
> daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von
> Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied?

Ich hatte es leider verpasst. 



-- 
Unpolitisch sein
heißt politisch sein
ohne es zu merken


signature.asc
Description: PGP signature


Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden MarkuB
Wolf-Heider Rein  t-online.de> writes:

> 
> Bei der Belegung einer Tastatur bin ich zu der Überzeugung gekommen, dass
man dafür NICHT ALLE
> Buchstabenfolgen betrachten und bewerten sollte, sondern nur die
Buchstabenfolgen innerhalb einer
> Silbe. 
> 
> Diese Ansicht beruht auf einer Untersuchung über die Steuerung der
Sprachmotorik, die ich gelesen habe.
> Die Versuchspersonen haben Texte a) mit einem Stift auf Papier und b) mit
einer Tastatur geschrieben. Der
> Ablauf der manuellen Bewegungen wurde elektronisch erfasst. In diesen
Texten kamen beispielsweise die
> drei Wörter “Kind" - "Linde - "hindurch“ vor. Die Analyse ergab, dass
unabhängig von der
> individuellen Schreibgeschwindigkeit und von der Schreibmethode
(Bleistift/Tastatur) die
> Zeitabstände zwischen gleichen Buchstabenpaaren in den Texten nicht gleich
war. Zum Beispiel: Der
> Zeitabstand zwischen den Buchstaben "n" und "d" war bei dem Wort "Kind" am
kleinsten, bei "Linde" war er
> ca. 20 Prozent größer, und bei "hindurch" war er ungefähr doppelt so groß. 
> 
> Das Sprachzentrum im Gehirn steuert die Schreibbewegungen demnach nicht
mit einer konstanten
> Buchstabengeschwindigkeit, sondern innerhalb einer Silbe schneller als an
den Silbengrenzen. Bei
> einer Belegung kommt es demnach darauf an, dass die Buchstabenfolgen
innerhalb einer Silbe
> griffgünstig liegen. An den Silbengrenzen spielt die Griffgünstigkeit eine
geringere Rolle. 
> 
> Deshalb erscheint es mir sinnvoll, die Griffgünstigkeit anhand der tausend
bis zehntausend
> häufigsten Wörter zu analysieren. Die Rangliste der häufigsten Wörter
besteht überwiegend aus
> sehr kurzen Wörtern, bei denen die Buchstabenfolgen an den Silbengrenzen
einen geringeren Anteil
> haben als bei einem Mix, der viele seltenere (und damit längere) Wörter
enthält. 
> 
> Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die
tausend (?) häufigsten
> Wörter einer Sprache. 
> Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere
die Buchstabenfolgen
> beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese
Silben sind meistens unbetont,
> und sollten sich mit flotten Bewegungen anfügen lassen.
>

Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was
daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von
Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied?