Re: [Neo] Wir brauchen den echten Korpus
Hallo MarkuB, inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen Texte buchstabenweise eingegeben werden, sondern mit einer Steno-Tastatur. Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem einzigen Buchstaben und dem Abstand gekürzt und viele weniger häufige Wörter mit zwei Buchstaben. Für die Flexionen werden besondere Kodes vorgesehen, die sich leicht greifen lassen und nicht die Buchstaben der Wortstämme verwenden. Das Programm läuft auf einem Scheckkartencomputer, den man zwischen Tastatur und PC einfügt, und der die eingegebenen Kürzungen in Klartext übersetzt. Das Ziel ist eine beträchtliche Erhöhung des Schreibtempos. Dies lässt sich nur erreichen, wenn man viel weniger Tasten drücken muss, als nachher Buchstaben auf dem Bildschirm erscheinen. Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der Buchstabe d in Texten recht häufig vor. Am häufigsten kommt er bei den Artikeln der, die, das, des, dem, den und der Konjunktionen und vor. Diese sieben Wörter werden jedoch mit einem anderen Buchstaben (nicht mit d) und dem Abstand gekürzt. Damit verliert das d erheblich an Häufigkeit und kann an einer weniger griffgünstigen Stelle des Tastenfeldes untergebracht werden. Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht gefunden. Ich will sie anhand der Häufigkeitsliste des Instituts für Deutsche Sprache in Mannheim ermitteln (320 000 Wörter mit Häufigkeitsangaben). Freundliche Grüße aus Pforzheim Wolf-Heider Rein whr...@t-online.de
Re: [Neo] Wir brauchen den echten Korpus
MarkuB writes: > Wolf-Heider Rein t-online.de> writes: >> Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die > tausend (?) häufigsten >> Wörter einer Sprache. Meine Erfahrung ist, dass selbst ein unschöner Übergang pro Seite deutlich spürbar ist. Deswegen vermute ich, dass tausend Wörter nicht reichen. Zumindest bei Bigrammen ist der Unterschied zwischen 3000 Bigrammen und allen Bigrammen soweit ich mich erinnere im Prozentbereich, und damit recht groß. Eine höherer Gewichtung von Übergängen innerhalb von Silben als von denen an Silbengrenzen dürfte trotzdem sinnvoll sein. Bisher verwende ich dafür nur als Proxy welche Silben in Stenographie gekürzt werden (weil das die häufigsten sind). >> Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere > die Buchstabenfolgen >> beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese > Silben sind meistens unbetont, >> und sollten sich mit flotten Bewegungen anfügen lassen. >> > > Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was > daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von > Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied? Ich hatte es leider verpasst. -- Unpolitisch sein heißt politisch sein ohne es zu merken signature.asc Description: PGP signature
Re: [Neo] Wir brauchen den echten Korpus
Wolf-Heider Rein t-online.de> writes: > > Bei der Belegung einer Tastatur bin ich zu der Überzeugung gekommen, dass man dafür NICHT ALLE > Buchstabenfolgen betrachten und bewerten sollte, sondern nur die Buchstabenfolgen innerhalb einer > Silbe. > > Diese Ansicht beruht auf einer Untersuchung über die Steuerung der Sprachmotorik, die ich gelesen habe. > Die Versuchspersonen haben Texte a) mit einem Stift auf Papier und b) mit einer Tastatur geschrieben. Der > Ablauf der manuellen Bewegungen wurde elektronisch erfasst. In diesen Texten kamen beispielsweise die > drei Wörter “Kind" - "Linde - "hindurch“ vor. Die Analyse ergab, dass unabhängig von der > individuellen Schreibgeschwindigkeit und von der Schreibmethode (Bleistift/Tastatur) die > Zeitabstände zwischen gleichen Buchstabenpaaren in den Texten nicht gleich war. Zum Beispiel: Der > Zeitabstand zwischen den Buchstaben "n" und "d" war bei dem Wort "Kind" am kleinsten, bei "Linde" war er > ca. 20 Prozent größer, und bei "hindurch" war er ungefähr doppelt so groß. > > Das Sprachzentrum im Gehirn steuert die Schreibbewegungen demnach nicht mit einer konstanten > Buchstabengeschwindigkeit, sondern innerhalb einer Silbe schneller als an den Silbengrenzen. Bei > einer Belegung kommt es demnach darauf an, dass die Buchstabenfolgen innerhalb einer Silbe > griffgünstig liegen. An den Silbengrenzen spielt die Griffgünstigkeit eine geringere Rolle. > > Deshalb erscheint es mir sinnvoll, die Griffgünstigkeit anhand der tausend bis zehntausend > häufigsten Wörter zu analysieren. Die Rangliste der häufigsten Wörter besteht überwiegend aus > sehr kurzen Wörtern, bei denen die Buchstabenfolgen an den Silbengrenzen einen geringeren Anteil > haben als bei einem Mix, der viele seltenere (und damit längere) Wörter enthält. > > Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die tausend (?) häufigsten > Wörter einer Sprache. > Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere die Buchstabenfolgen > beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese Silben sind meistens unbetont, > und sollten sich mit flotten Bewegungen anfügen lassen. > Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied?