> Neben dem Korpus ist natürlich interessant was für ein Algorithmus zur > Optimierung der Tastatur genommen wird.
Derzeit wird vorwiegend der Leipziger Korpus verwendet. Alternativen sind Bücher von Projekt Gutenberg. Ich benutze zum Teil Artikel von der c't-Archiv-DVD. An Algorithmen gibt es evolutionäre (Ulfs Optimierer), solche die Vertauschungen durchführen bis keine mehr eine Verbesserung bringt und dann wieder ganz von vorne anfangen (Arnes und mein Optimierer), und gewisse Hoffnungen, gemischt ganzahlig-lineare Verfahren benutzen zu können. Zu letzteren bitte das Mailarchiv (ca. Januar) befragen. > Ich meine ich hätte in irgendeiner e-mail in den letzten Wochen etwas von > einer Kostenfunktion gelesen. Wenn du den entsprechenden Thread („Kriterien für ein optimiertes Layout“ ) liest bist du ziemlich auf der Höhe der aktuellen Diskussion. > Diesbezüglich würde mich auch interessieren, ob ihr n-Gramme nutzt und wenn > ja wieviel stellig ist das n-Gramm (Bigramm, Trigramm, ...)? Mein Optimierer geht bis zu Bigrammen, Arnes bis zu Trigrammen (soweit ich weiß, er kann mich ja korrigieren). Wobei die Kriterien für n=1 unklar sind und mit steigendem n unklarer werden. > (vielleicht steige ich nach Beendigung des Studiums noch mit ein). Danach? Uns interessiert schon jetzt, welchen systematischen Einfluss die Wahl eines bestimmten Korpus hat. Zum Beispiel ist Ulf aufgefallen, dass im Leipziger Korpus Punkte häufiger als Kommas sind. In einem „literarischen“ Korpus ist es anders rum. Was weiß der Linguist zum Zusammenhang zwischen Textgattung und 1-, 2- und 3-Grammhäufigkeiten? Andreas
