Re: [Neo] Wir brauchen den echten Korpus

2016-09-29 Diskussionsfäden Jo Tasmo
Hallo  Wolf-Heider Rein,

ist schon länger her, dass die Mail unterwegs war.

>>inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen
Texte buchstabenweise eingegeben werden, sondern mit einer Steno-Tastatur.
 <
… gibt es dazu nähere Infos (Links)? Hatte mal etwas gegooglt und bin aber
nur auf »tatsächliche« Steno-Tastaturen gestoßen, für die man Steno können
muss.

Gruß

Jochen

Am 1. Februar 2016 um 11:21 schrieb MarkuB :

> Hallo,
> hast ein wenig das Thema verfehlt, ist aber nicht schlimm. Beim Korpus
> handelt es sich um eine Auswahl deutscher Sätze aus verschiedenen Quellen,
> die die deutsche Sprache repräsentieren. Das wird dafür gebraucht um
> mittels einer Software eine neue Tastaturbelegung ermitteln zu können, die
> vielleicht noch besser optimiert ist.
>
> Was die ErgoDox angeht bin ich der Ansicht, dass Daumentasten generell
> eine gute Idee sind, aber es sind zu viele und der Abstand ist zu groß.
>
> Ich hab mir selbst was gebastelt
>
> https://neo2-layout.blogspot.de/
>
>
> Am 30.01.2016 um 12:09 schrieb Jochen Sum:
>
>> Hallo,
>>
>> ich bin recht neu in der Mailinglist und bin auch erst kürzlich auf Neo
>> gestoßen. Als 10 Fingertipper ist klar:
>>   So weit es möglich ist die Grund-»Stellung« zu halten -
>> koste es was es wolle???  Bei dem ErgoDox, auf das ich
>> durch den Thread erst aufmerksam wurde, knickt beim
>> mir das »koste es was es wolle« zugegebener Weise schon ein.
>>   Allerdings kam mir, durch die handweise geteilte Tastatur, die Idee,
>> dass
>> man dann auch gleich die Maus in die re Tastatur einbauen könnte. Man
>> müsste dafür eventuell eine Handballen-Auflage zum bewegen der re
>> Tastatur konsipieren. So könnte man z.B. mit einem Tastendruck
>> einen Maus-Modus aktivieren und hätte - locker - aus der Grundstellung
>> heraus vier  »Maus«-Tasten zur Verfügung, von der Erweiterung des
>> »Maus-Modus« über die restliche rechte, sowie die linke Tastatur, ganz
>> zu schweigen.
>>   Das setzt allerdings einen aufgeräumten Schreibtisch voraus. Hier
>> lassen sich aber mit einem Schneeschipper schnelle Ergebnisse erzielen.
>>   Ansonsten bin ich, nach relative kurzem »mich hineinversetzen«, von
>> der Tastenanordnung der ErgoDox nicht 100% überzeugt. Obwohl ich das
>> Konzept mit den Daumetasten sehr gut finde.
>>   Das liegt aber sicher - mit - an den deutschen Umlaut-Tasten.
>>   Wohl ein generelles Problem:
>> »One World viele Tasten - beziehungsweise viele verschiedene
>> Uni-Code-Zeichen.«
>>   Frage: Wie bewähren sich die »vielen« Daumentasten?
>> Wäre es nicht besser die Tasten der ersten Reihe zu teilen und die der
>> Hinteren groß zu machen?
>>
>> Gruß
>>
>>
>>
>>
>>
>>
>> Am 28. Januar 2016 um 16:29 schrieb Rein Wolf-Heider > >:
>>
>> Hallo MarkuB,
>>
>> inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen
>> Texte buchstabenweise eingegeben werden, sondern mit einer
>> Steno-Tastatur.
>> Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem
>> einzigen Buchstaben und dem Abstand gekürzt und viele weniger
>> häufige Wörter mit zwei Buchstaben.. Für die Flexionen werden
>> besondere Kodes vorgesehen, die sich leicht greifen lassen und nicht
>> die Buchstaben der Wortstämme verwenden.
>>
>> Das Programm läuft auf einem Scheckkartencomputer, den man zwischen
>> Tastatur und PC einfügt, und der die eingegebenen Kürzungen in
>> Klartext übersetzt. Das Ziel ist eine beträchtliche Erhöhung des
>> Schreibtempos. Dies lässt sich nur erreichen, wenn man viel weniger
>> Tasten drücken muss, als nachher Buchstaben auf dem Bildschirm
>> erscheinen.
>>
>> Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der
>> Buchstabe *d* in Texten recht häufig vor. Am häufigsten kommt er bei
>> den Artikeln *der, die, das, des, dem, den* und der Konjunktionen
>> *und* vor. Diese sieben Wörter werden jedoch mit einem anderen
>> Buchstaben (nicht mit *d*)**und dem Abstand gekürzt. Damit verliert
>> das *d* erheblich an Häufigkeit und kann an einer weniger
>> griffgünstigen Stelle des Tastenfeldes untergebracht werden.
>>
>> Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht
>> gefunden. Ich will sie anhand der Häufigkeitsliste des Instituts für
>> Deutsche Sprache in Mannheim ermitteln (320 000 Wörter mit
>> Häufigkeitsangaben).
>>
>> Freundliche Grüße aus Pforzheim
>> Wolf-Heider Rein
>> whr...@t-online.de 
>>
>>
>>
>
>
>


Re: [Neo] Wir brauchen den echten Korpus

2016-02-01 Diskussionsfäden MarkuB

Hallo,
hast ein wenig das Thema verfehlt, ist aber nicht schlimm. Beim Korpus 
handelt es sich um eine Auswahl deutscher Sätze aus verschiedenen 
Quellen, die die deutsche Sprache repräsentieren. Das wird dafür 
gebraucht um mittels einer Software eine neue Tastaturbelegung ermitteln 
zu können, die vielleicht noch besser optimiert ist.


Was die ErgoDox angeht bin ich der Ansicht, dass Daumentasten generell 
eine gute Idee sind, aber es sind zu viele und der Abstand ist zu groß.


Ich hab mir selbst was gebastelt

https://neo2-layout.blogspot.de/

Am 30.01.2016 um 12:09 schrieb Jochen Sum:

Hallo,

ich bin recht neu in der Mailinglist und bin auch erst kürzlich auf Neo
gestoßen. Als 10 Fingertipper ist klar:
  So weit es möglich ist die Grund-»Stellung« zu halten -
koste es was es wolle???  Bei dem ErgoDox, auf das ich
durch den Thread erst aufmerksam wurde, knickt beim
mir das »koste es was es wolle« zugegebener Weise schon ein.
  Allerdings kam mir, durch die handweise geteilte Tastatur, die Idee, dass
man dann auch gleich die Maus in die re Tastatur einbauen könnte. Man
müsste dafür eventuell eine Handballen-Auflage zum bewegen der re
Tastatur konsipieren. So könnte man z.B. mit einem Tastendruck
einen Maus-Modus aktivieren und hätte - locker - aus der Grundstellung
heraus vier  »Maus«-Tasten zur Verfügung, von der Erweiterung des
»Maus-Modus« über die restliche rechte, sowie die linke Tastatur, ganz
zu schweigen.
  Das setzt allerdings einen aufgeräumten Schreibtisch voraus. Hier
lassen sich aber mit einem Schneeschipper schnelle Ergebnisse erzielen.
  Ansonsten bin ich, nach relative kurzem »mich hineinversetzen«, von
der Tastenanordnung der ErgoDox nicht 100% überzeugt. Obwohl ich das
Konzept mit den Daumetasten sehr gut finde.
  Das liegt aber sicher - mit - an den deutschen Umlaut-Tasten.
  Wohl ein generelles Problem:
»One World viele Tasten - beziehungsweise viele verschiedene
Uni-Code-Zeichen.«
  Frage: Wie bewähren sich die »vielen« Daumentasten?
Wäre es nicht besser die Tasten der ersten Reihe zu teilen und die der
Hinteren groß zu machen?

Gruß






Am 28. Januar 2016 um 16:29 schrieb Rein Wolf-Heider >:

Hallo MarkuB,

inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen
Texte buchstabenweise eingegeben werden, sondern mit einer
Steno-Tastatur.
Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem
einzigen Buchstaben und dem Abstand gekürzt und viele weniger
häufige Wörter mit zwei Buchstaben.. Für die Flexionen werden
besondere Kodes vorgesehen, die sich leicht greifen lassen und nicht
die Buchstaben der Wortstämme verwenden.

Das Programm läuft auf einem Scheckkartencomputer, den man zwischen
Tastatur und PC einfügt, und der die eingegebenen Kürzungen in
Klartext übersetzt. Das Ziel ist eine beträchtliche Erhöhung des
Schreibtempos. Dies lässt sich nur erreichen, wenn man viel weniger
Tasten drücken muss, als nachher Buchstaben auf dem Bildschirm
erscheinen.

Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der
Buchstabe *d* in Texten recht häufig vor. Am häufigsten kommt er bei
den Artikeln *der, die, das, des, dem, den* und der Konjunktionen
*und* vor. Diese sieben Wörter werden jedoch mit einem anderen
Buchstaben (nicht mit *d*)**und dem Abstand gekürzt. Damit verliert
das *d* erheblich an Häufigkeit und kann an einer weniger
griffgünstigen Stelle des Tastenfeldes untergebracht werden.

Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht
gefunden. Ich will sie anhand der Häufigkeitsliste des Instituts für
Deutsche Sprache in Mannheim ermitteln (320 000 Wörter mit
Häufigkeitsangaben).

Freundliche Grüße aus Pforzheim
Wolf-Heider Rein
whr...@t-online.de 








Re: [Neo] Wir brauchen den echten Korpus

2016-01-30 Diskussionsfäden paul

Hallo Jochen,
schön dass du den Weg zu Neo und zu alternativen Tastaturen allgemein
gefunden hast. :-)
Leider bin ich mir nicht ganz sicher, was du damit meinst: (und hast du 
dich evtl im Thread geirrt? Das hat ja nichts mehr mit dem deutschen 
Korpus zu tun.)



So weit es möglich ist die Grund-»Stellung« zu halten - koste es was
es wolle???  Bei dem ErgoDox, auf das ich durch den Thread erst
aufmerksam wurde, knickt beim mir das »koste es was es wolle«
zugegebener Weise schon ein.

Macht das die ErgoDox nun gut oder nicht?


Allerdings kam mir, durch die handweise geteilte Tastatur, die Idee,
dass man dann auch gleich die Maus in die re Tastatur einbauen
könnte. Man müsste dafür eventuell eine Handballen-Auflage zum
bewegen der re Tastatur konsipieren. So könnte man z.B. mit einem
Tastendruck einen Maus-Modus aktivieren und hätte - locker - aus der
Grundstellung heraus vier  »Maus«-Tasten zur Verfügung, von der
Erweiterung des »Maus-Modus« über die restliche rechte, sowie die
linke Tastatur, ganz zu schweigen.

Das gibt es z.T. schon, siehe hier:
"Keymouse" https://www.keymouse.com/about
"King's Assembly"
https://www.kickstarter.com/projects/70308014/kings-assembly-a-computer-mouse-full-of-awesome

(Da bewegt man jeweils die ganze Tastatur-Hälfte. Ich glaube diese
Projekte sind aber weniger auf Vielschreiber ausgelegt als auf Grafiker,
Designer, CAD-Nutzer, die sowohl Maus als auch Tastatur brauchen. Mit
zwei Mäusen sollte auch die 3d-Navigation besser sein.)


Ansonsten bin ich, nach relative kurzem »mich hineinversetzen«, von
der Tastenanordnung der ErgoDox nicht 100% überzeugt. Obwohl ich das
 Konzept mit den Daumetasten sehr gut finde. Das liegt aber sicher -
mit - an den deutschen Umlaut-Tasten. Wohl ein generelles Problem:
»One World viele Tasten - beziehungsweise viele verschiedene
Uni-Code-Zeichen.«
Was stört dich denn an der Tastenanordnung? Das Matrix-Layout? Obwohl 
ich erst seit rund einer Woche darauf tippe kann ich sagen, dass das (in 
Verbindung mit den mechanischen Tasten) das angenehmste Tippgefühl ist, 
was ich je hatte.
Es gab schon Überlegungen bzw. Prototypen, die die Tasten-Spalten 
fächerförmig verteilen wollten, so wie sich die Finger wirklich bewegen. 
Das ist aber nur sehr schwer zu realisieren, v.a. mit den 
Standard-Keycaps. (Schau dir eventuell mal das Keyboard IO an).



Frage: Wie bewähren sich die »vielen«
Daumentasten? Wäre es nicht besser die Tasten der ersten Reihe zu
teilen und die der Hinteren groß zu machen?
Bei mir bisher ganz gut. Ich habe auf den großen Shift, Space und Enter 
(zusammen mit Neo Mod4); auf den kleinen die Modifier (Strg,Alt,Super,Mod3).
Die Daumen sind präzise genug, als dass sie die großen Tasten nicht 
bräuchten. Es ist bloß angenehmer, finde ich, seinen ganzen Daumen 
darauf ablegen zu können. Achja, die Shift-Taste auf dem Daumen hat sich 
mehr als bewährt. Macht das Tippen insgesamt sehr viel angenehmer!


Problematisch ist eher, dass die äußeren Daumentasten zu weit weg sind. 
Für Leute mit kleinen Händen könnte das schwierig werden.
Aber auch hier gibt es schon interessante Mods der Community, u.a. 
welche die den Thumbcluster um 90° versetzt an das Hauptfeld gebastelt 
haben, sodass der Daumen in seiner natürlichen Bewegungsrichtung auf die 
Tasten drücken kann. Leider gibt es da nicht mehr als ein paar 
Prototypen, aber ich bin sehr gespannt was da noch kommt.


Paul




Re: [Neo] Wir brauchen den echten Korpus

2016-01-30 Diskussionsfäden Jochen Sum
... da steig ich mit den Threads noch nicht so ganz durch. Auch inhaltlich
hat sich in den paar Tagen mein Horizont explosionsartig erweitert. Sehr
informativ, aber auch der Komplexität entsprechen verwirrend.
 Um mich dann doch noch in das Thema einzureihen:
 Ist mit Korpus eine festgelegte Basis gemeint?
Wie z.B. die Ebene 1-3 der Neo2. Denn dann driften die Belegungs-Interessen
deutlich auseinander.  Ich persönlich bin typografisch indisch orientiert
und mit griechischem gar nichts zu tun.
 Da hängten sich bei mir auch etwas die Bedenken bezüglich der ErgoDox auf.
 Denn ich stellte mir die Frage, ob es in einer sinnvollen Relation steht,
sich für auf statistischen »Mini«-Prozent beruhende Vorteile zu weit vom
Standard weg zu bewegen? Dies bezog sich z.B. auf die um platzierte ›ENTER‹
und ›Tab‹ Taste.
Eben um eines Korpus willens.


Bei mir bisher ganz gut. Ich habe auf den großen Shift, Space und Enter
(zusammen mit Neo Mod4); auf den kleinen die Modifier (Strg,Alt,Super,Mod3).
Die Daumen sind präzise genug, als dass sie die großen Tasten nicht
bräuchten. Es ist bloß angenehmer, finde ich, seinen ganzen Daumen darauf
ablegen zu können. Achja, die Shift-Taste auf dem Daumen hat sich mehr als
bewährt. Macht das Tippen insgesamt sehr viel angenehmer!

Problematisch ist eher, dass die äußeren Daumentasten zu weit weg sind. Für
Leute mit kleinen Händen könnte das schwierig werden.
Aber auch hier gibt es schon interessante Mods der Community, u.a. welche
die den Thumbcluster um 90° versetzt an das Hauptfeld gebastelt haben,
sodass der Daumen in seiner natürlichen Bewegungsrichtung auf die Tasten
drücken kann. Leider gibt es da nicht mehr als ein paar Prototypen, aber
ich bin sehr gespannt was da noch kommt.
‹‹

Das war schon einmal eine bereichernde Antwort.
Denn ohne praktischem Ausprobieren, keine praktische Erfahrung.

›

Aber auch hier gibt es schon interessante Mods der Community, u.a. welche
die den Thumbcluster um 90° versetzt an das Hauptfeld gebastelt haben,
sodass der Daumen in seiner natürlichen Bewegungsrichtung auf die Tasten
drücken kann. Leider gibt es da nicht mehr als ein paar Prototypen, aber
ich bin sehr gespannt was da noch kommt.

‹

Das war auch ein guter Hinweis.
Morgen hole ich aus meinem Bastellager, Plastellin (Knetmasse) und werde
mich daran machen an die ErgoDox angelehnt eine zu modellieren.
Habe Erfahrung mit Silicon-Kautschuk und möchte da einer Selbstbauidee.
Das Zeug ist auch nicht so billig, aber da steht noch eine Dose rum.


Womit wir bei meiner wort-spielerischen Anspielung auf die Kosten wären.
Klar das der Preis so speziell ist, wie das Produkt und dessen
Verkaufszahlen.

 Vom halten der Grundstellung her ist das Teil sicher Klasse.

Aber ich hab da irgendwo gelesen, es geht hier um einen Korpus.
Deshalb wurde ich mich noch über Tipps zu meiner  folgenden
Schlussfolgerung - dieses Mal bezüglich einer Kernbelegung - freuen.

Und zwar:
Aus der Perspektive des Neo-Einsteigers erscheint es mir sinnvoll einen
Korpus der auf allgemeinen Erkenntnissen entwickelt wurde, für den Neuling
anzubieten. Denn ich finde das Umlernen überraschen flüssig, wenn der Speed
auch noch etwas Zeit braucht. Dann aber über Tutorials oder durch Software
eine - vielleicht zum fließenden Übergang - zu verfeinerten
benutzerdefinierten Layouts für die Allgemeinheit gangbar zu machen.
Vielleicht gibt es diese Pfade schon.
Dann wäre ich über einen Hinweis froh.
Wo find ich Infos, Anleitungen, Tutorials e.t.c. wie man die keymaps
(vorzüglich Linux) entsprechend Anpasst. Die Layouts sind ja auch
anwendungsbedingt unterschiedlich sinnvoll (LaTex, Vim e.t.c). Ein
weitgefächertes Gebiet eben.

So dann überlasse ich den tiefer Eingedrungenen das Feld und bemühe mich in
Zukunft den rechten Thread zu finden.

Gruß

Jochen



Am 30. Januar 2016 um 13:38 schrieb paul :

> Hallo Jochen,
> schön dass du den Weg zu Neo und zu alternativen Tastaturen allgemein
> gefunden hast. :-)
> Leider bin ich mir nicht ganz sicher, was du damit meinst: (und hast du
> dich evtl im Thread geirrt? Das hat ja nichts mehr mit dem deutschen Korpus
> zu tun.)
>
> So weit es möglich ist die Grund-»Stellung« zu halten - koste es was
>> es wolle???  Bei dem ErgoDox, auf das ich durch den Thread erst
>> aufmerksam wurde, knickt beim mir das »koste es was es wolle«
>> zugegebener Weise schon ein.
>>
> Macht das die ErgoDox nun gut oder nicht?
>
> Allerdings kam mir, durch die handweise geteilte Tastatur, die Idee,
>> dass man dann auch gleich die Maus in die re Tastatur einbauen
>> könnte. Man müsste dafür eventuell eine Handballen-Auflage zum
>> bewegen der re Tastatur konsipieren. So könnte man z.B. mit einem
>> Tastendruck einen Maus-Modus aktivieren und hätte - locker - aus der
>> Grundstellung heraus vier  »Maus«-Tasten zur Verfügung, von der
>> Erweiterung des »Maus-Modus« über die restliche rechte, sowie die
>> linke Tastatur, ganz zu schweigen.
>>
> Das gibt es z.T. schon, siehe 

Re: [Neo] Wir brauchen den echten Korpus

2016-01-30 Diskussionsfäden Jochen Sum
Hallo,

ich bin recht neu in der Mailinglist und bin auch erst kürzlich auf Neo
gestoßen. Als 10 Fingertipper ist klar:
 So weit es möglich ist die Grund-»Stellung« zu halten -
koste es was es wolle???  Bei dem ErgoDox, auf das ich
durch den Thread erst aufmerksam wurde, knickt beim
mir das »koste es was es wolle« zugegebener Weise schon ein.
 Allerdings kam mir, durch die handweise geteilte Tastatur, die Idee, dass
man dann auch gleich die Maus in die re Tastatur einbauen könnte. Man
müsste dafür eventuell eine Handballen-Auflage zum bewegen der re Tastatur
konsipieren. So könnte man z.B. mit einem Tastendruck
einen Maus-Modus aktivieren und hätte - locker - aus der Grundstellung
heraus vier  »Maus«-Tasten zur Verfügung, von der Erweiterung des
»Maus-Modus« über die restliche rechte, sowie die linke Tastatur, ganz zu
schweigen.
 Das setzt allerdings einen aufgeräumten Schreibtisch voraus. Hier lassen
sich aber mit einem Schneeschipper schnelle Ergebnisse erzielen.
 Ansonsten bin ich, nach relative kurzem »mich hineinversetzen«, von der
Tastenanordnung der ErgoDox nicht 100% überzeugt. Obwohl ich das Konzept
mit den Daumetasten sehr gut finde.
 Das liegt aber sicher - mit - an den deutschen Umlaut-Tasten.
 Wohl ein generelles Problem:
»One World viele Tasten - beziehungsweise viele verschiedene
Uni-Code-Zeichen.«
 Frage: Wie bewähren sich die »vielen« Daumentasten?
Wäre es nicht besser die Tasten der ersten Reihe zu teilen und die der
Hinteren groß zu machen?

Gruß






Am 28. Januar 2016 um 16:29 schrieb Rein Wolf-Heider :

> Hallo MarkuB,
>
> inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen Texte
> buchstabenweise eingegeben werden, sondern mit einer Steno-Tastatur.
>
> Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem einzigen
> Buchstaben und dem Abstand gekürzt und viele weniger häufige Wörter mit
> zwei Buchstaben. Für die Flexionen werden besondere Kodes vorgesehen, die
> sich leicht greifen lassen und nicht die Buchstaben der Wortstämme
> verwenden.
>
> Das Programm läuft auf einem Scheckkartencomputer, den man zwischen
> Tastatur und PC einfügt, und der die eingegebenen Kürzungen in Klartext
> übersetzt. Das Ziel ist eine beträchtliche Erhöhung des Schreibtempos. Dies
> lässt sich nur erreichen, wenn man viel weniger Tasten drücken muss, als
> nachher Buchstaben auf dem Bildschirm erscheinen.
>
> Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der
> Buchstabe *d* in Texten recht häufig vor. Am häufigsten kommt er bei den
> Artikeln *der, die, das, des, dem, den* und der Konjunktionen *und* vor.
> Diese sieben Wörter werden jedoch mit einem anderen Buchstaben (nicht mit
> *d*) und dem Abstand gekürzt. Damit verliert das *d* erheblich an
> Häufigkeit und kann an einer weniger griffgünstigen Stelle des Tastenfeldes
> untergebracht werden.
>
> Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht gefunden.
> Ich will sie anhand der Häufigkeitsliste des Instituts für Deutsche Sprache
> in Mannheim ermitteln (320 000 Wörter mit Häufigkeitsangaben).
>
> Freundliche Grüße aus Pforzheim
> Wolf-Heider Rein
> whr...@t-online.de
>


Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden MarkuB
Wolf-Heider Rein  t-online.de> writes:

> 
> Bei der Belegung einer Tastatur bin ich zu der Überzeugung gekommen, dass
man dafür NICHT ALLE
> Buchstabenfolgen betrachten und bewerten sollte, sondern nur die
Buchstabenfolgen innerhalb einer
> Silbe. 
> 
> Diese Ansicht beruht auf einer Untersuchung über die Steuerung der
Sprachmotorik, die ich gelesen habe.
> Die Versuchspersonen haben Texte a) mit einem Stift auf Papier und b) mit
einer Tastatur geschrieben. Der
> Ablauf der manuellen Bewegungen wurde elektronisch erfasst. In diesen
Texten kamen beispielsweise die
> drei Wörter “Kind" - "Linde - "hindurch“ vor. Die Analyse ergab, dass
unabhängig von der
> individuellen Schreibgeschwindigkeit und von der Schreibmethode
(Bleistift/Tastatur) die
> Zeitabstände zwischen gleichen Buchstabenpaaren in den Texten nicht gleich
war. Zum Beispiel: Der
> Zeitabstand zwischen den Buchstaben "n" und "d" war bei dem Wort "Kind" am
kleinsten, bei "Linde" war er
> ca. 20 Prozent größer, und bei "hindurch" war er ungefähr doppelt so groß. 
> 
> Das Sprachzentrum im Gehirn steuert die Schreibbewegungen demnach nicht
mit einer konstanten
> Buchstabengeschwindigkeit, sondern innerhalb einer Silbe schneller als an
den Silbengrenzen. Bei
> einer Belegung kommt es demnach darauf an, dass die Buchstabenfolgen
innerhalb einer Silbe
> griffgünstig liegen. An den Silbengrenzen spielt die Griffgünstigkeit eine
geringere Rolle. 
> 
> Deshalb erscheint es mir sinnvoll, die Griffgünstigkeit anhand der tausend
bis zehntausend
> häufigsten Wörter zu analysieren. Die Rangliste der häufigsten Wörter
besteht überwiegend aus
> sehr kurzen Wörtern, bei denen die Buchstabenfolgen an den Silbengrenzen
einen geringeren Anteil
> haben als bei einem Mix, der viele seltenere (und damit längere) Wörter
enthält. 
> 
> Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die
tausend (?) häufigsten
> Wörter einer Sprache. 
> Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere
die Buchstabenfolgen
> beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese
Silben sind meistens unbetont,
> und sollten sich mit flotten Bewegungen anfügen lassen.
>

Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was
daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von
Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied?



Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden Arne Babenhauserheide

MarkuB writes:

> Wolf-Heider Rein  t-online.de> writes:
>> Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die
> tausend (?) häufigsten
>> Wörter einer Sprache.

Meine Erfahrung ist, dass selbst ein unschöner Übergang pro Seite
deutlich spürbar ist. Deswegen vermute ich, dass tausend Wörter nicht
reichen. Zumindest bei Bigrammen ist der Unterschied zwischen 3000
Bigrammen und allen Bigrammen soweit ich mich erinnere im
Prozentbereich, und damit recht groß.

Eine höherer Gewichtung von Übergängen innerhalb von Silben als von
denen an Silbengrenzen dürfte trotzdem sinnvoll sein. Bisher verwende
ich dafür nur als Proxy welche Silben in Stenographie gekürzt werden
(weil das die häufigsten sind).

>> Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere
> die Buchstabenfolgen
>> beachtet, die an den Wortenden der flektierten Wörter auftreten. Diese
> Silben sind meistens unbetont,
>> und sollten sich mit flotten Bewegungen anfügen lassen.
>>
>
> Ich weiß, dass das Thema schon älter ist, aber mich würde interessieren, was
> daraus geworden ist. Hat schon mal jemand versucht, ein Layout auf Basis von
> Silben statt Trigrammen zu erstellen? Gäbe es da einen Unterschied?

Ich hatte es leider verpasst. 



-- 
Unpolitisch sein
heißt politisch sein
ohne es zu merken


signature.asc
Description: PGP signature


Re: [Neo] Wir brauchen den echten Korpus

2016-01-28 Diskussionsfäden Rein Wolf-Heider
Hallo MarkuB,

inzwischen befasse ich mich nicht mehr mit Tastaturen, bei denen Texte 
buchstabenweise eingegeben werden, sondern mit einer Steno-Tastatur.
 
Bei ihr werden die dreißig häufigsten deutschen Wörter mit einem einzigen 
Buchstaben und dem Abstand gekürzt und viele weniger häufige Wörter mit zwei 
Buchstaben. Für die Flexionen werden besondere Kodes vorgesehen, die sich 
leicht greifen lassen und nicht die Buchstaben der Wortstämme verwenden. 

Das Programm läuft auf einem Scheckkartencomputer, den man zwischen Tastatur 
und PC einfügt, und der die eingegebenen Kürzungen in Klartext übersetzt. Das 
Ziel ist eine beträchtliche Erhöhung des Schreibtempos. Dies lässt sich nur 
erreichen, wenn man viel weniger Tasten drücken muss, als nachher Buchstaben 
auf dem Bildschirm erscheinen. 

Dieses Ziel führt zu neuen Gesichtspunkten. Beispielsweise kommt der Buchstabe 
d in Texten recht häufig vor. Am häufigsten kommt er bei den Artikeln der, die, 
das, des, dem, den und der Konjunktionen und vor. Diese sieben Wörter werden 
jedoch mit einem anderen Buchstaben (nicht mit d) und dem Abstand gekürzt. 
Damit verliert das d erheblich an Häufigkeit und kann an einer weniger 
griffgünstigen Stelle des Tastenfeldes untergebracht werden.

Eine Häufigkeitsliste der deutschen Silben habe ich bisher nicht gefunden. Ich 
will sie anhand der Häufigkeitsliste des Instituts für Deutsche Sprache in 
Mannheim ermitteln (320 000 Wörter mit Häufigkeitsangaben).

Freundliche Grüße aus Pforzheim
Wolf-Heider Rein
whr...@t-online.de

Re: [Neo] Wir brauchen den echten Korpus

2011-06-20 Diskussionsfäden Dennis Heidsiek

Hallo allerseits,


Michael Gattinger ſchrieb am 16.06.2011 17:54 Uhr:
Auch ich finde Konsens / Kompromis richtig. Jedoch gehst du von einer 
Diskussion aus, die meiner Meinung nach garnichtmehr stattfindet, 


Stimmt, da habe ich dich falsch verstanden. Ich schiebe das mal auf die 
Mailingliste-hat-Schnupfen-Zwangspause in Verbindung mit Altersdemenz 
meinerseits ;).


Was die  Zusammenstellung des Korpus angeht, habe ich mir noch keine 
Meinung gebildet; einerseits ist Neo vor allen Dingen auf die deutsche 
Sprache optimiert (so dass der deutschsprachige Anteil im Korpus auf 
jeden Fall der wichtigste sein muss), andererseits ist die Wichtigkeit 
des Englischen nicht zu leugnen. Doch wenn man mit Fremdwörtern anfängt, 
müsste man sicherlich auch noch Französisch, Latein, … miteinbeziehen. 
Die Gefahr dabei ist jedoch, dass die Erfolge der Optimierung verwässert 
werden könnten; irgendwann landet man dann bei der Europastatur, mit der 
man zwar alle Sprachen schreiben kann – aber nicht unbedingt bequem. 
Irgendwo muss sich da der ›richtige‹ Punkt verstecken, bis zu dem die 
Gewinne durch einen fremden Korpus die geringfügigen Nachteile für den 
›Primärkorpus‹ auffwiegen … und nachdem die Nachteile die Vorteile 
überwiegen. Doch wo genau dieser Punkt in Prozent liegen mag, kann ich 
nicht beurteilen … ich glaube, da wäre wohl eine weitere interessante 
Fragestellung für den Optimierer.



Viele Grüße,
Dennis-ſ




Re: [Neo] Wir brauchen den echten Korpus

2011-06-16 Diskussionsfäden Michael Gattinger

Am 15.06.2011 19:38, schrieb Dennis Heidsiek:


Bei der Belegungsfindung für Neo2 haben wir Abstimmungen nur als 
allerletztes Mittel eingesetzt, als alle inhaltlichen Argumente 
ausgetauscht, die Diskussion absolut verfahren und die Fronten 
verhärtet waren.


Ich finde diese auf Konsens/Kompromisse orientierte Arbeitsweise 
richtig; wenn das Thema einfach noch nicht ausreichend 
durchgesprochen/durchdacht ist, halte ich eine frühzeitige Abstimmung 
für eine schlechte Idee.


Auch ich finde Konsens / Kompromis richtig. Jedoch gehst du von einer 
Diskussion aus, die meiner Meinung nach garnichtmehr stattfindet, 
weshalb ich einfach nur darauf hinweisen wollte, dass ich mich über eine 
Diskussion betreffend 22.05.2011 21:59 freuen würde.
Das Thema hat sich danach übrigends in ein Sub-Thema geteilt, was mMn 
nichtsmehr mit der Ursprungsfrage Welche Prozentualen Anteile sollen 
wir verwenden? zu tun hat. Dies würde ich garne Diskutieren und habe 
mit 22.05.2011 21:59 dazu einen Beitrag zur Diskussionsgrundlage 
geliefert, der nicht Diskustiert wurde.




Re: [Neo] Wir brauchen den echten Korpus

2011-06-15 Diskussionsfäden Michael Gattinger

Da die Mailingliste nun wieder zu funktionieren scheint nochmal:



Guten Morgen Leute,

ich würde mich, da die Frage immernoch offen im Raume steht über 
Reaktionen zu meiner Vorarbeit freuen. Es wäre schön wenn wir in einer 
Diskussion uns einigen können oder irgendwann mal eine Abstimmung einleiten.


Am 22.05.2011 21:59, schrieb Michael Gattinger:

Moinsen,

ich hab mir eine Statistik zu den Fremdsprachenkenntnissen angeschaut, 
siehe Anhang


Weiter siehe 22.05.2011 21:59




Re: [Neo] Wir brauchen den echten Korpus

2011-06-15 Diskussionsfäden Dennis Heidsiek

Hallo allerseits,


Michael Gattinger ſchrieb am 15.06.2011 12:15 Uhr:
Es wäre schön wenn wir in einer Diskussion uns einigen können oder 
irgendwann mal eine Abstimmung einleiten.


Bei der Belegungsfindung für Neo2 haben wir Abstimmungen nur als 
allerletztes Mittel eingesetzt, als alle inhaltlichen Argumente 
ausgetauscht, die Diskussion absolut verfahren und die Fronten verhärtet 
waren.


Ich finde diese auf Konsens/Kompromisse orientierte Arbeitsweise 
richtig; wenn das Thema einfach noch nicht ausreichend 
durchgesprochen/durchdacht ist, halte ich eine frühzeitige Abstimmung 
für eine schlechte Idee.



Viele Grüße,
Dennis-ſ



Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Arne Babenhauserheide
On Tuesday 31 May 2011 20:50:21 Wolf Belschner wrote:
 Am 31.05.2011 19:10, schrieb Arne Babenhauserheide:
  Als Vergleich: Qwertz hat eine Standardabweichung bei Wörtern von über
  1200, AdnW kommt über 1400, und Qwertz hat so Monster wie „zerfasert“
  und „gesondert“.

 solche offensichtlichen Monster sind mir aber bei AdNW noch nicht
 begegnet, irgendwas kann da immer noch nicht stimmen ???

Es gibt ein paar Kriterien, die mit der vierten Potenz skalieren. Wenn AdnW
die nutzt, kann das sehr heftig reinhauen.

Sehr unschöne ngramme sind die hier (Großbuchstaben werden in shift-sequenzen
aufgeteilt, \n heißt Return):

0.039 \nf
0.026 \nA
0.024 \nH
0.019 \nI
0.010 \nF
0.007 \nE
0.006 \nO
0.003 \nK
0.002 \nU
0.001 \nY
0.000 \nQ
0.000 \nX

0.008 If
0.004 W
0.004 bg
0.004 OF
0.003 Ev
0.003 wv
0.003 bv
0.003 fm
0.003 M
0.003 Af
0.002 N
0.002 IV
0.002 B
0.002 VE
0.002 Of
0.002 mf
0.001 gb
0.001 -M
0.001 VI
0.001 EV
0.001 JO
0.001 !
0.001 C
0.001 D
0.001 'S
0.000 RK
0.000 F
0.000 -L
0.000 IF
0.000 KS
0.000 KM
0.000 R'
0.000 FE
0.000 Ov
0.000 G
0.000 OV
0.000 US
0.000 R
0.000 S'
0.000 VO
0.000 S:
0.000 L
0.000 f;
0.000 vw
0.000 'C
0.000 -F
0.000 J
0.000 FO
0.000 V
0.000 -J
0.000 Ef
0.000 OJ
0.000 JE
0.000 XV
0.000 L'
0.000 pv
0.000 FU
0.000 EF
0.000 v1
0.000 Iv
0.000 UL
0.000 -W
0.000 'R
9e-05 vp
7e-05 vb
6e-05 FI
6e-05 FA
6e-05 AF
6e-05 Aj
6e-05 AV
6e-05 Av
6e-05 SU
6e-05 f'
6e-05 'f
6e-05 'N
6e-05 v
6e-05 LU
6e-05 [E
6e-05 'W
6e-05 (P
6e-05 UD
6e-05 'M
6e-05 'G


Jeder [Return-Zeichen links] bedeutet z.B., dass erst Return und dann shift
rechts gedrückt werden muss: Eine Kleinfingerwiederholung.

\nf hat beispielsweise Kosten von knapp 8000, bg von knapp 6700.

Erstellt via

./bigramm_statistik.py -f Korpora/Gutenberg/English/4899.txt.utf8 \
-l kuü.ä vgcljf´
hieao dtrnsß
xyö,q bpwmz
 --bars -n 100

gepiped durch

| grep
\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*
-B 1 | sed s/\*.*//  | grep ^[a-zA-Z] -B 1

(für die Zeichen mit Zeilenumbruch als erstes Zeichen) und

| grep
\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*
| sed s/\*.*//  | grep ^[0-9]

(für die ohne)

Liebe Grüße,
Arne

PS: Es kann sein, dass Bigramme mit Zeilenumbrüchen als erstem Zeichen
niedriger gewichtet werden sollten. Erfahrungswert?

signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Arne Babenhauserheide
On Tuesday 31 May 2011 20:50:21 Wolf Belschner wrote:
 Am 31.05.2011 19:10, schrieb Arne Babenhauserheide:
  Als Vergleich: Qwertz hat eine Standardabweichung bei Wörtern von über
  1200, AdnW kommt über 1400, und Qwertz hat so Monster wie „zerfasert“
  und „gesondert“.

 solche offensichtlichen Monster sind mir aber bei AdNW noch nicht
 begegnet, irgendwas kann da immer noch nicht stimmen ???

f scheint viel auszumachen

schau mal: t gegen f getauscht:

./regularity_check.py  -t adnw-korpus.txt  -l kuü.ä vgcljt´
 hieao dfrnsß
 xyö,q bpwmz
 
mean value and standard deviation of the layout cost:
snippets of 270 letters: 461.209498711 ± 303.222772129 (65.7451273176%)
words: 342.953127535 ± 2415.39100732 (704.29187355%)

1400 → 2400

Liebe Grüße,
Arne
--
1w6 sie zu achten,
sie alle zu finden,
in Spiele zu leiten
und sacht zu verbinden.
→ http://1w6.org



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Wolf Belschner
Am 01.06.2011 09:17, schrieb Arne Babenhauserheide:

 Es gibt ein paar Kriterien, die mit der vierten Potenz skalieren. Wenn AdnW 
 die nutzt, kann das sehr heftig reinhauen.


Danke für die Liste der unschönen Bigramme in AdNW. Dass wir wieder bei
der Position des F in AdNW landen hatte ich schon fast vermutet. Wenn
ich das so durchgehe kann ich allerdings nicht alles nachvollziehen, was
ich da sehe

 Sehr unschöne ngramme sind die hier (Großbuchstaben werden in shift-sequenzen 
 aufgeteilt, \n heißt Return): 
 
 0.039 \nf
 0.026 \nA
 0.024 \nH
 0.019 \nI
 0.010 \nF
 0.007 \nE
 0.006 \nO
 0.003 \nK
 0.002 \nU
 0.001 \nY
 0.000 \nQ
 0.000 \nX   

das Problem mit dem Return sehe ich so nicht, halte ich für absolut
überbewertet. Wenn man einen Return tippt und jetzt nicht gerade mit
einer mechanischen Schreibmaschine arbeitet bedeutet das praktisch immer
einen Absatz im Textfluß, man fängt danach neu an, meist mit
Shift+Buchstabe. Zugegeben ist Return + F eine haarige Kombi in AdNW die
einen aus der Balance werfen kann, was mir sicher auch schon passiert
ist aber es geht an der Realität vorbei, normalerweise tippt man Return
und fängt dann einen Satz neu an, was eine kleine Pause beinhaltet und
damit auch das Problem deutlich entschärft.

 
 0.008 If 

If zugegeben ganz schlimm in AdNW, muss man wirklich lernen, kommt aber
eigentlich nur in Englisch vor wenn man einen Satz mit If anfängt.
ansonsten fällt mir da nur die Ifflandstraße in München ein ;)

 0.004 W 
Diese Kombis mit  + Großbuchstabe dürften auf jeder Belegung ihre
Punkte machen. Gleiches gilt auch für die Kombinationen von
Großbuchstaben je nach ihrer Lage auf der Tastatur. 'USA' ist schlecht
zu tippen, wird aber auf fast jeder Belegung so sein.

 0.004 bg
 0.001 gb

Fällt mir einmal gelernt nicht mehr weiter auf, ist auch praktisch immer
eine Silbentrennung  'Abgang', das Gehirn schreibt Ab und gang, halte
ich für viel zu schlecht bewertet.


 0.003 Ev 
 0.003 wv 
 0.003 bv

stört mich absolut nicht mehr, auch v fängt meist eine Silbe an.

 0.003 fm 
 0.002 mf

die sind schon blöde, muss man wirklich lernen, sind aber eher selten
mpf stört mich öfter, muss man lernen

 
 Jeder [Return-Zeichen links] bedeutet z.B., dass erst Return und dann shift 
 rechts gedrückt werden muss: Eine Kleinfingerwiederholung.
 
 \nf hat beispielsweise Kosten von knapp 8000, bg von knapp 6700.
 
 
 PS: Es kann sein, dass Bigramme mit Zeilenumbrüchen als erstem Zeichen 
 niedriger gewichtet werden sollten. Erfahrungswert?

siehe Kommentar oben.


Was mich hier wirklich erstaunt ist die Diskrepanz zwischen
Schreibempfinden und statistischer Bewertung, das stimmt so nicht ganz
zusammen. Aber ich denke wir kommen dem schon auf die Spur.

Da ich fast nur Fliesstext schreibe (ich würde mal sagen 99%) und jetzt
auch schon einige Übung habe mit AdNW,¹ habe ich schon erwartet, dass
die Standardabweichungen mit den extremen Positionen von f und k zu tun
haben. K trägt dazu laut Liste kaum was bei obwohl ich mich damit fast
am öftesten verhaue, ich glaube auch Matthias hat davon schon berichtet.

Das F liegt an einer extremen Position die natürlich in der Bewertung
für Strafpunkte sorgt, die Position ist aber im täglichen Gebrauch auf
der schräg versetzen Tastatur besser als die des j (qwertz p). Und sie
schafft nicht nur Nachteile:
Der große Charme daran ist, wenn man sich mal daran gewöhnt hat, dass
diese Position die Nicht-Benachbartheit der Finger weiter reduziert, das
Geschehen auf der Tastatur entzerrt was IMHO den Schreibfluss deutlich
fördert. Man nimmt dadurch ganz klar ein paar punktuelle Nachteile in
Kauf, aber ich denke es schafft im großen und ganzen mehr Platz und
Komfort (mf!!! ich hab mich promt vertippt dabei!:) ), ein Faktor dem
deine bisherige Bewertung wenig Rechnung trägt.

Wenn ich mir so ansehe was ich oben zu bg und bv gesagt habe könnte man
in Bezug auf Tippbarkeit durchaus über eine Gewichtung der n-gramme wie
Wolf-Heider Rein sie vorschlägt nachdenken, das hat schon was für sich.

Ich denke in der Richtung muss noch einiges geschehen bis wirklich
tippbare Belegungen dabei rauskommen.

Grüße

Wolf


PS:
Ich habe mir mal das easy layout vorgenommen und damit ein paar
beliebige Testworte eingegeben:
 blue, black, truncated, whole, easy, yellow, delight, videoscreen,
board, beard, background, traffic, drugs, sample, itinerary, those,
government, roadblock, jealousy. b und d sind problematisch.
Das ist natürlich nicht repräsentativ und nicht fair, vieles geht auch
sehr gut damit aber es geht nicht so gut wie ich eigentlich erwartet hätte.




¹ allerdings in der Variante
ku,äq vgcljf
hiaeo dtrnsß
yx.üö bpwmz
was an der rechten Seite nichts ändert, nur die Nicht-Benachbartheit
noch höher schraubt.



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Wolf Belschner
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

Ok, ich schick das jetzt nochmal, da es offenbar nicht in der Neogroup
angekommen ist


Am 01.06.2011 09:17, schrieb Arne Babenhauserheide:

  Es gibt ein paar Kriterien, die mit der vierten Potenz skalieren.
Wenn AdnW
  die nutzt, kann das sehr heftig reinhauen.
 
Danke für die Liste der unschönen Bigramme in AdNW. Dass wir wieder bei
der Position des F in AdNW landen hatte ich schon fast vermutet. Wenn
ich das so durchgehe kann ich allerdings nicht alles nachvollziehen, was
ich da sehe

  Sehr unschöne ngramme sind die hier (Großbuchstaben werden in
shift-sequenzen
  aufgeteilt, \n heißt Return):
 
  0.039 \nf
  0.026 \nA
  0.024 \nH
  0.019 \nI
  0.010 \nF
  0.007 \nE
  0.006 \nO
  0.003 \nK
  0.002 \nU
  0.001 \nY
  0.000 \nQ
  0.000 \nX
das Problem mit dem Return sehe ich so nicht, halte ich für absolut
überbewertet. Wenn man einen Return tippt und jetzt nicht gerade mit
einer mechanischen Schreibmaschine arbeitet bedeutet das praktisch immer
einen Absatz im Textfluß, man fängt danach neu an, meist mit
Shift+Buchstabe. Zugegeben ist Return + F eine haarige Kombi in AdNW die
einen aus der Balance werfen kann, was mir sicher auch schon passiert
ist aber es geht an der Realität vorbei, normalerweise tippt man Return
und fängt dann einen Satz neu an, was eine kleine Pause beinhaltet und
damit auch das Problem deutlich entschärft.

 
  0.008 If
If zugegeben ganz schlimm in AdNW, muss man wirklich lernen, kommt aber
eigentlich nur in Englisch vor wenn man einen Satz mit If anfängt.
ansonsten fällt mir da nur die Ifflandstraße in München ein ;)
Oder ist da vielleicht Programmcode in der Grundlage???

  0.004 W
Diese Kombis mit  + Großbuchstabe dürften auf jeder Belegung ihre
Punkte machen. Gleiches gilt auch für die Kombinationen von
Großbuchstaben je nach ihrer Lage auf der Tastatur. 'USA' ist schlecht
zu tippen, wird aber auf fast jeder Belegung so sein.

  0.004 bg
  0.001 gb
Fällt mir einmal gelernt nicht mehr weiter auf, ist auch praktisch immer
eine Silbentrennung  'Abgang', das Gehirn schreibt Ab und gang, halte
ich für viel zu schlecht bewertet.


  0.003 Ev
  0.003 wv
  0.003 bv
stört mich absolut nicht mehr, auch v fängt meist eine Silbe an.

  0.003 fm
  0.002 mf
die sind schon blöde, muss man wirklich lernen, sind aber eher selten
mpf stört mich öfter, muss man lernen

 
  Jeder [Return-Zeichen links] bedeutet z.B., dass erst Return und
dann shift
  rechts gedrückt werden muss: Eine Kleinfingerwiederholung.
 
  \nf hat beispielsweise Kosten von knapp 8000, bg von knapp 6700.
 
 
  PS: Es kann sein, dass Bigramme mit Zeilenumbrüchen als erstem Zeichen
  niedriger gewichtet werden sollten. Erfahrungswert?
siehe Kommentar oben.


Was mich hier wirklich erstaunt ist die Diskrepanz zwischen
Schreibempfinden und statistischer Bewertung, das stimmt so nicht ganz
zusammen. Aber ich denke wir kommen dem schon auf die Spur.

Da ich fast nur Fliesstext schreibe (ich würde mal sagen 99%) und jetzt
auch schon einige Übung habe mit AdNW,¹ habe ich schon erwartet, dass
die Standardabweichungen mit den extremen Positionen von f und k zu tun
haben. K trägt dazu laut Liste kaum was bei obwohl ich mich damit fast
am öftesten verhaue, ich glaube auch Matthias hat davon schon berichtet.

Das F liegt an einer extremen Position die natürlich in der Bewertung
für Strafpunkte sorgt, die Position ist aber im täglichen Gebrauch auf
der schräg versetzen Tastatur besser als die des j (qwertz p). Und sie
schafft nicht nur Nachteile:
Der große Charme daran ist, wenn man sich mal daran gewöhnt hat, dass
diese Position die Nicht-Benachbartheit der Finger weiter reduziert, das
Geschehen auf der Tastatur entzerrt was IMHO den Schreibfluss deutlich
fördert. Man nimmt dadurch ganz klar ein paar punktuelle Nachteile in
Kauf, aber ich denke es schafft im großen und ganzen mehr Platz und
Komfort (mf!!! ich hab mich promt vertippt dabei! :) ), ein Faktor dem
deine bisherige Bewertung wenig Rechnung trägt.

Wenn ich mir so ansehe was ich oben zu bg und bv gesagt habe könnte man
in Bezug auf Tippbarkeit durchaus über eine Gewichtung der n-gramme wie
Wolf-Heider Rein sie vorschlägt nachdenken, das hat schon was für sich.

Ich denke in der Richtung muss noch einiges geschehen bis wirklich
tippbare Belegungen dabei rauskommen.

Grüße

Wolf


PS:
Ich habe mir mal das easy layout vorgenommen und damit ein paar
beliebige Testworte eingegeben:
 blue, black, truncated, whole, easy, yellow, delight, videoscreen,
board, beard, background, traffic, drugs, sample, itinerary, those,
government, roadblock, jealousy. b und d sind problematisch.
Das ist natürlich nicht repräsentativ und nicht fair, vieles geht auch
sehr gut damit aber es geht nicht so gut wie ich eigentlich erwartet hätte.




¹ allerdings in der Variante
ku,äq vgcljf
hiaeo dtrnsß
yx.üö bpwmz
was an der rechten Seite nichts ändert, nur die Nicht-Benachbartheit
noch höher schraubt.


-BEGIN PGP SIGNATURE-
Version: GnuPG v2.0.14 

Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Arne Babenhauserheide
On Wednesday 01 June 2011 16:03:24 Wolf Belschner wrote:
 das Problem mit dem Return sehe ich so nicht, halte ich für absolut
 überbewertet.

Das hatte ich deswegen im PS geschrieben. Ich vermute auch, dass es mit am
Korpus liegt. Wenn ich es über einen Text von mir jage, landet es bei nur
einer Standardabweichung von 6xx.

 Zugegeben ist Return + F eine haarige Kombi in AdNW die
 einen aus der Balance werfen kann, was mir sicher auch schon passiert
 ist aber es geht an der Realität vorbei, normalerweise tippt man Return
 und fängt dann einen Satz neu an, was eine kleine Pause beinhaltet und
 damit auch das Problem deutlich entschärft.

Das Problem zeigt sich in der Gesamtwertung ja auch deutlich schwächer :)

 Was mich hier wirklich erstaunt ist die Diskrepanz zwischen
 Schreibempfinden und statistischer Bewertung, das stimmt so nicht ganz
 zusammen. Aber ich denke wir kommen dem schon auf die Spur.

Grundlegend ist die Bewertung gut. Sie zeigt nur eine extrem hohe Varianz. Mut
mf und \nf passt das ja teils schon.

 Da ich fast nur Fliesstext schreibe (ich würde mal sagen 99%) und jetzt
 auch schon einige Übung habe mit AdNW,¹ habe ich schon erwartet, dass
 die Standardabweichungen mit den extremen Positionen von f und k zu tun
 haben. K trägt dazu laut Liste kaum was bei obwohl ich mich damit fast
 am öftesten verhaue, ich glaube auch Matthias hat davon schon berichtet.

Da müssen möglicherweise die Kosten der Position noch hoch.

 Wenn ich mir so ansehe was ich oben zu bg und bv gesagt habe könnte man
 in Bezug auf Tippbarkeit durchaus über eine Gewichtung der n-gramme wie
 Wolf-Heider Rein sie vorschlägt nachdenken, das hat schon was für sich.

Jupp, wir müssen nur einen guten Weg finden, das zu machen. Der dedizierte
nGramm-Generator machtn mir Hoffnung.

 Ich habe mir mal das easy layout vorgenommen und damit ein paar
 beliebige Testworte eingegeben:

Dazu vorher: Der Name ist immer schlecht zu tippen (easy) :)

  blue, black, truncated, whole, easy, yellow, delight, videoscreen,
 board, beard, background, traffic, drugs, sample, itinerary, those,
 government, roadblock, jealousy. b und d sind problematisch.
 Das ist natürlich nicht repräsentativ und nicht fair, vieles geht auch
 sehr gut damit aber es geht nicht so gut wie ich eigentlich erwartet hätte.

Lässt sich halt nur in Grenzen optimieren. Irgendwo ist leider die Grenze der
Sprache. Aber es ist möglich einerseits dafür zu sorgen, dass es bei seltenen
Wörtern passiert, und andererseits, dass die übelsten Übergänge auf nGramme
verschoben werden, die in der Sprache gar nicht vorkommen. Ich vermute, dass
es deutlich mehr recht schlechte Übergänge gibt als echt grausige. Wenn die
echt grausigen völlig vermieden werden, heißt das halt, dass es mehr recht
schlechte gibt. wir haben nur eine begrenzte Zahl übergänge, die wir ganz
killen können.

Ich habe inzwischen übrigens auch gemerkt, dass die Benachbarkeit runter muss.
Wenn die Hände überlastet sind, tut die nämlich nochmal deutlich mehr weh.


--
Konstruktive Kritik:

- http://draketo.de/licht/krude-ideen/konstruktive-kritik



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Wolf Belschner
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

Am 01.06.2011 20:35, schrieb Arne Babenhauserheide:

 Grundlegend ist die Bewertung gut. Sie zeigt nur eine extrem hohe Varianz. 
 Mut 
 mf und \nf passt das ja teils schon. 

Ich denke dass \nf vorwiegend aus Programmiercode im Korpus stammt, ich
kann mir nicht erklären, in welchem Zusammenhang \nf sonst in der
Häufigkeit vorkommt. \nfor

Ich lass mich aber gerne auch eines Besseren belehren, nur komm ich
grade auf keine andere Erklärung

Gruß

Wolf
-BEGIN PGP SIGNATURE-
Version: GnuPG v2.0.14 (MingW32)

iQEcBAEBAgAGBQJN5qmDAAoJEOW1q9pls7UNEuAH/jJzcujYbALt7bZMhzI9OIOO
7oiR3kQ+tV9DyqTYZi+H1sdGNW1xJYFDNx2Ws4OY0e8b0M7Fd29evfBZmUMfd32c
o3BXptuiIUvMA8iqQeeec19Wj2qvaVxeZdro91K6V1sUpsST0L0+OegwADQ1pnYk
z4QIvECpI+qdKmoSq3cnKr/pCv1DuAAJNC8iKjym9ML+gEC/yEmr/6mk+k1l4J+x
C3WHuP6ile8huA6PqoiHp+w0eCGmYldP99nI9RrzM50an3fy7wkUC6WhbY702bK8
UsBPqMGbp9FUa89YZMSR1dkcazEPZ3Aqz/j2YL5PF8ZCzaEvc7kCwIwTyGuKS/o=
=Rzcp
-END PGP SIGNATURE-



Re: [Neo] Wir brauchen den echten Korpus

2011-06-01 Diskussionsfäden Arne Babenhauserheide
On Wednesday 01 June 2011 23:05:08 Wolf Belschner wrote:
 Ich denke dass \nf vorwiegend aus Programmiercode im Korpus stammt, ich
 kann mir nicht erklären, in welchem Zusammenhang \nf sonst in der
 Häufigkeit vorkommt. \nfor

 Ich lass mich aber gerne auch eines Besseren belehren, nur komm ich
 grade auf keine andere Erklärung

naja,

fucking english
fucking has so
fucking many
fucking words that
fucking start with
fucking f

:)

Bei meinem eigenen (deutschen) Text ist die Standardabweichung von AdnW nur
~600 → deutlich besser.

Liebe Grüße,
Arne
--
1w6 sie zu achten,
sie alle zu finden,
in Spiele zu leiten
und sacht zu verbinden.
→ http://1w6.org



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Wolf Belschner
Am 30.05.2011 17:35, schrieb Arne Babenhauserheide:
 Qwertz: 
 snippets of 270 letters: 957.825201294 ± 422.314896543 (44.0910195276%)
 words: 488.000271844 ± 1272.01170344 (260.657990749%)
 
 Dvorak: 
 snippets of 270 letters: 355.464618085 ± 197.802365471 (55.6461474384%)
 words: 223.55820448 ± 621.277269116 (277.904034236%)
 
 Pfubsie (nur Deutsch): 
 snippets of 270 letters: 238.440936648 ± 108.466998756 (45.4900908712%)
 words: 176.257013533 ± 287.036763107 (162.851257577%)
 
 Easy (Nur Englisch): 
 snippets of 270 letters: 250.987728546 ± 165.050594115 (65.7604238546%)
 words: 182.363915564 ± 390.392453455 (214.073300767%)
 
 AdnW: 
 snippets of 270 letters: 278.504827291 ± 204.224877078 (73.3290259507%)
 words: 224.829276972 ± 1447.6902046 (643.906444966%)
 
 
 …hm…
 
 Das Ergebnis sagt aus, dass es viele Wörter gibt, die sich mit AdnW extrem 
 schlecht tippen lassen (mehr als bei Pfubsie), dass es im allgemeinen aber so 
 gut ist wie Dvorak (nach der Wertung von meinem Optimierer; mit dem von 
 Andreas sieht es sicher anders aus!). 

Das heißt aber auch im Umkehrschluss, dass es eine Menge Wörter gibt,
die sich damit extrem gut tippen lassen (immer nach den Kriterien deines
Optimierers)

Es fällt mir beim täglichen Schreiben nicht mehr so auf, aber wenn ich
darüber nachdenke hat das auch eine gewisse Richtigkeit. Es gibt eine
Menge Wörter die sich mit AdNW sozusagen von alleine tippen, sie fallen
einfach aus den Tasten und lassen sich mit extrem hoher Geschwindigkeit
bewältigen, es sind vor allem die normalen Wörter des täglichen
Gebrauchs und immer wiederkehrende Wortteile aus denen ein Großteil der
Sätze besteht. (werden, sein, haben, alles mit ich, lich, erst, isch,
esch, mach, nach, heit, keit, enen, schaft, usw). Komplexere Wörter
bereiten oft mehr Schwierigkeiten, wobei ich das nicht mehr so empfinde,
auch ‚Psychologie‘ lässt sich noch relativ gut bewältigen aber es bremst
etwas aus. Die Schwierigkeit, dass sich einzelne alltäglich Wörter
extrem schlecht tippen lassen weil sich tatsächlich die Finger dabei
verheddern hatte ich in viel höherem Maß bei Nordtast und noch schlimmer
bei Neo2. Zumindest waren es da auch oft völlig alltägliche Worte die
ausgebremst haben.

 Für mich ist das extrem überraschend. Ich hätte bei AdnW eine viel größere 
 Regelmäßigkeit erwartet, erst recht nach den Lobliedern, die manche AdnW-
 Nutzer darauf singen. 

Wenn ich genau darüber nachdenke finde ich es jetzt nicht so
überraschend. Was mir bei AdNW schon auffällt ist, dass es trotz
leichter Lernbarkeit relativ lange dauert, das Tippen wirklich rund zu
kriegen, geschuldet der Tatsache, dass sich viele alltägliche Worte
sozusagen hirnlos vollautomatisch tippen, dazwischen aber für
speziellere Worte oft deutlich mehr Aufmerksamkeit aufgebracht werden
muss. Meine Tippgeschwindigkeit liegt jetzt bei ca. 300 Anschlägen, und
ich merke immer noch, dass es sehr von der Tagesform abhängig ist ob
sich das Tippen ‚rund‘ anfühlt oder ob es immer wieder stockt bei den
komplexeren Sachen, aber insgesamt gibt es nicht allzu viel das dabei
wirklich stört, man bricht sich nicht die Finger dabei. Ich denke auch
nach wie vor, dein Optimierer bewertet einige Fingerbewegungen
schlechter als eigentlich sein müsste.

Vielleicht als Anregung und Schlussfolgerung daraus einen Testkorpus
zusammenstellen aus 1000 bis 3000 häufigsten oder besser gesagt
banalsten Worten und das zum Gegentesten einer Belegung zu verwenden, es
würde einfach zeigen, wie gut eine Belegung mit den banalen
Standardaufgaben des Alltags zurechtkommt, also den Worten (und
eventuell auch Wortteilen) aus denen die Sätze zum Großteil bestehen.

Dass Du AdNW in deine Untersuchung miteinbeziehst ist insofern auch
interessant und richtig, als es wenigstens eine Handvoll Leute gibt, die
damit arbeiten und was dazu sagen können, ich denke aus dem Fall lässt
sich noch einiges lernen. Es ist insgesamt immer noch das geschmeidigste
Layout das ich bis jetzt kenne.

Grüße

Wolf


-- 
Those who were seen dancing were thought to be insane
by those who could not hear the music...



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Arne Babenhauserheide
On Tuesday 31 May 2011 11:40:08 Wolf Belschner wrote:
  Für mich ist das extrem überraschend. Ich hätte bei AdnW eine viel
  größere  Regelmäßigkeit erwartet, erst recht nach den Lobliedern, die
  manche AdnW- Nutzer darauf singen.

 Wenn ich genau darüber nachdenke finde ich es jetzt nicht so
 überraschend. Was mir bei AdNW schon auffällt ist, dass es trotz
 leichter Lernbarkeit relativ lange dauert, das Tippen wirklich rund zu
 kriegen, geschuldet der Tatsache, dass sich viele alltägliche Worte
 sozusagen hirnlos vollautomatisch tippen, dazwischen aber für
 speziellere Worte oft deutlich mehr Aufmerksamkeit aufgebracht werden
 muss.

Dann passt das Ergebnis anscheinend doch…

Das erklärt auch, warum AdnW bei mir nur so gut wie Dvorak abschneidet:
Seltene Worte werden vermutlich bei mir anders gewertet als bei Andreas.

Wenn sie rausgerechnet werden, dürfte AdnW deutlich besser abschneiden,
allerdings halt nur für eine Teilmenge der Tipparbeit.

Ein Grund dafür drfte sein, dass der Optimierer von AdnW bestimmte Bewegungen
als gut bewertet, die meiner als absolut grausig sieht (es gibt einige
Bigramme, die alleine schon Kosten von 4000 Strafpunkten einfahren, also 2000
pro Zeichen, und es gibt auch ein paar ganz verbotene, die *richtig* weh tun…

| Komplexere Wörter bereiten oft mehr Schwierigkeiten, wobei ich das nicht
mehr so empfinde, auch ‚Psychologie‘ lässt sich noch relativ gut bewältigen
aber es bremst etwas aus.

Hundertprozentig lässt sich das nicht entfernen, aber ich hoffe, dass es sich
deutlich reduzieren lässt.

Das Problem bei den Vergleichen ist das gleiche wie bei dem Vergleich Neo
gegen Qwertz: Das was man kennt, läuft gut. Wenn dich die Problemwörter bei
AdnW oft genug genervt haben, laufen sie automatisch und fallen nicht mehr
auf. Bei einer neuen Belegung gibt es immer Problemwörter, die du noch nicht
drin hast und die deswegen stören.

--
Konstruktive Kritik:

- http://draketo.de/licht/krude-ideen/konstruktive-kritik



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Wolf Belschner
Am 31.05.2011 16:07, schrieb Arne Babenhauserheide:

 Ein Grund dafür drfte sein, dass der Optimierer von AdnW bestimmte Bewegungen 
 als gut bewertet, die meiner als absolut grausig sieht (es gibt einige 
 Bigramme, die alleine schon Kosten von 4000 Strafpunkten einfahren, also 2000 
 pro Zeichen, und es gibt auch ein paar ganz verbotene, die *richtig* weh tun… 
 
 | Komplexere Wörter bereiten oft mehr Schwierigkeiten, wobei ich das nicht 
 mehr so empfinde, auch ‚Psychologie‘ lässt sich noch relativ gut bewältigen 
 aber es bremst etwas aus. 
 
 Hundertprozentig lässt sich das nicht entfernen, aber ich hoffe, dass es sich 
 deutlich reduzieren lässt. 

Das lässt sich sicher nicht entfernen und ich denke auch nur reduzieren
auf Kosten einer allgemeinen Tippbarkeit. Es sind immer noch 32
Buchstaben auf die gleichen 32 Tasten zu verteilen, das heisst, je nach
Korpus lässt sich das sicher in die eine oder andere Richtung
beeinflussen. Die besonderen Wörter wird man immer besonders lernen müssen.

Eine niedrigere Standardabweichung heisst dann aber nur, dass die
Aufgaben die der Gesamtkorpus stellt gleichmäßiger zu bewältigen sind,
aber nicht unbedingt, dass das auch tatsächlich besser ist was die
allgemeine Tippbarkeit betrifft.

Angenommen als Extrembeispiel: Man könnte einen extremen Korpus mit
medizinischen Texten nehmen oder auch eine Programmiersprache und eine
Belegung ermitteln mit der sich dies gut und smooth und ohne allzu große
Standardabweichung bewältigen lässt, die dann aber schon beim Tippen
einer normalen Mail sich hakelig verhält.

Vielleicht ein Hinweis darauf den Korpus nicht mit zuvielen
Spezialgebieten zu belasten, sowohl was Sprachen, als auch besondere
Wortschätze betrifft.

Gruß

Wolf



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Wolf-Heider Rein
Bei der Belegung einer Tastatur bin ich zu der Überzeugung gekommen, dass man 
dafür NICHT ALLE Buchstabenfolgen betrachten und bewerten sollte, sondern nur 
die Buchstabenfolgen innerhalb einer Silbe. 

Diese Ansicht beruht auf einer Untersuchung über die Steuerung der 
Sprachmotorik, die ich gelesen habe. Die Versuchspersonen haben Texte a) mit 
einem Stift auf Papier und b) mit einer Tastatur geschrieben. Der Ablauf der 
manuellen Bewegungen wurde elektronisch erfasst. In diesen Texten kamen 
beispielsweise die drei Wörter “Kind - Linde - hindurch“ vor. Die Analyse 
ergab, dass unabhängig von der individuellen Schreibgeschwindigkeit und von der 
Schreibmethode (Bleistift/Tastatur) die Zeitabstände zwischen gleichen 
Buchstabenpaaren in den Texten nicht gleich war. Zum Beispiel: Der Zeitabstand 
zwischen den Buchstaben n und d war bei dem Wort Kind am kleinsten, bei 
Linde war er ca. 20 Prozent größer, und bei hindurch war er ungefähr 
doppelt so groß. 

Das Sprachzentrum im Gehirn steuert die Schreibbewegungen demnach nicht mit 
einer konstanten Buchstabengeschwindigkeit, sondern innerhalb einer Silbe 
schneller als an den Silbengrenzen. Bei einer Belegung kommt es demnach darauf 
an, dass die Buchstabenfolgen innerhalb einer Silbe griffgünstig liegen. An den 
Silbengrenzen spielt die Griffgünstigkeit eine geringere Rolle. 

Deshalb erscheint es mir sinnvoll, die Griffgünstigkeit anhand der tausend bis 
zehntausend häufigsten Wörter zu analysieren. Die Rangliste der häufigsten 
Wörter besteht überwiegend aus sehr kurzen Wörtern, bei denen die 
Buchstabenfolgen an den Silbengrenzen einen geringeren Anteil haben als bei 
einem Mix, der viele seltenere (und damit längere) Wörter enthält. 

Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die 
tausend (?) häufigsten Wörter einer Sprache. 
Bei der Belegung der Tasten für eine Einhandtastatur habe ich insbesondere die 
Buchstabenfolgen beachtet, die an den Wortenden der flektierten Wörter 
auftreten. Diese Silben sind meistens unbetont, und sollten sich mit flotten 
Bewegungen anfügen lassen.

Wolf-Heider Rein

Am 31.05.2011 um 16:07 schrieb Arne Babenhauserheide:

 On Tuesday 31 May 2011 11:40:08 Wolf Belschner wrote:
 Für mich ist das extrem überraschend. Ich hätte bei AdnW eine viel
 größere  Regelmäßigkeit erwartet, erst recht nach den Lobliedern, die
 manche AdnW- Nutzer darauf singen.
 
 Wenn ich genau darüber nachdenke finde ich es jetzt nicht so
 überraschend. Was mir bei AdNW schon auffällt ist, dass es trotz
 leichter Lernbarkeit relativ lange dauert, das Tippen wirklich rund zu
 kriegen, geschuldet der Tatsache, dass sich viele alltägliche Worte
 sozusagen hirnlos vollautomatisch tippen, dazwischen aber für
 speziellere Worte oft deutlich mehr Aufmerksamkeit aufgebracht werden
 muss.
 
 Dann passt das Ergebnis anscheinend doch… 
 
 Das erklärt auch, warum AdnW bei mir nur so gut wie Dvorak abschneidet: 
 Seltene Worte werden vermutlich bei mir anders gewertet als bei Andreas.
 
 Wenn sie rausgerechnet werden, dürfte AdnW deutlich besser abschneiden, 
 allerdings halt nur für eine Teilmenge der Tipparbeit.
 
 Ein Grund dafür drfte sein, dass der Optimierer von AdnW bestimmte Bewegungen 
 als gut bewertet, die meiner als absolut grausig sieht (es gibt einige 
 Bigramme, die alleine schon Kosten von 4000 Strafpunkten einfahren, also 2000 
 pro Zeichen, und es gibt auch ein paar ganz verbotene, die *richtig* weh tun… 
 
 | Komplexere Wörter bereiten oft mehr Schwierigkeiten, wobei ich das nicht 
 mehr so empfinde, auch ‚Psychologie‘ lässt sich noch relativ gut bewältigen 
 aber es bremst etwas aus. 
 
 Hundertprozentig lässt sich das nicht entfernen, aber ich hoffe, dass es sich 
 deutlich reduzieren lässt. 
 
 Das Problem bei den Vergleichen ist das gleiche wie bei dem Vergleich Neo 
 gegen Qwertz: Das was man kennt, läuft gut. Wenn dich die Problemwörter bei 
 AdnW oft genug genervt haben, laufen sie automatisch und fallen nicht mehr 
 auf. Bei einer neuen Belegung gibt es immer Problemwörter, die du noch nicht 
 drin hast und die deswegen stören. 
 
 --
 Konstruktive Kritik: 
 
 - http://draketo.de/licht/krude-ideen/konstruktive-kritik
 




Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Arne Babenhauserheide
On Tuesday 31 May 2011 18:12:15 Wolf Belschner wrote:
 Eine niedrigere Standardabweichung heisst dann aber nur, dass die
 Aufgaben die der Gesamtkorpus stellt gleichmäßiger zu bewältigen sind,
 aber nicht unbedingt, dass das auch tatsächlich besser ist was die
 allgemeine Tippbarkeit betrifft.

Die Standardabweichung bei Wörtern kann auf etwa ⅕ der Abweichung bei AdnW
gedrückt werden. Bei 270 Zeichen auf die Hälfte. Und das finde ich doch recht
heftig.

Für die allgemeine Tippbarkeit dürfte das bedeuten, dass es weniger Brüche im
Tippfluss gibt, und weniger starke. Das sehe ich persönlich als sehr wichtig an
(sonst hätte ich das Skript zum Testen der Standardabweichung nicht schon
letztes Jahr geschrieben :) ). Die Belegung dürfte schneller zu lernen und
entspannter zu tippen sein.

Als Vergleich: Qwertz hat eine Standardabweichung bei Wörtern von über 1200,
AdnW kommt über 1400, und Qwertz hat so Monster wie „zerfasert“ und
„gesondert“.

Der Test hätte uns übrigens vor der Schwäche von Pfubsie gewarnt: Beim
Englischen Text hatte es eine Standardabweichung bei Wörtern von über 500,
während “easy” auf knapp 280 kam. Das ist fast Faktor 2 (y scheint da heftig
zuzuschlagen :) ).


Pfubsie:
snippets of 270 letters: 253.87993151 ± 183.484690556 (72.2722309967%)
words: 175.341368632 ± 546.501984656 (311.678863304%)

Easy:
snippets of 270 letters: 215.04338335 ± 123.634617547 (57.4928721923%)
words: 153.816528692 ± 278.440901013 (181.021443782%)


Nebenbei: Jemand wollte mal ein gutes Layout nur für Englisch. Da wäre easy
ein Beispiel (allerdings nur für englische Prosa, nicht für code oder die
shell):

http://draketo.de/dateien/layouts/easy-adnw.png
http://draketo.de/dateien/layouts/easy-adnw.svg
http://draketo.de/dateien/layouts/easy-gutt.png
http://draketo.de/dateien/layouts/easy-gutt.svg

Liebe Grüße,
Arne
--
1w6 sie zu achten,
sie alle zu finden,
in Spiele zu leiten
und sacht zu verbinden.
→ http://1w6.org



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Arne Babenhauserheide
On Tuesday 31 May 2011 19:06:23 Wolf-Heider Rein wrote:
 Wahrscheinlich (?) genügen für eine ausreichend aussagefähige Analyse die
 tausend (?) häufigsten Wörter einer Sprache.

Das verzerrt die Belegung deutlich (weil bestimmte Übergängeplötzlich völlig
ignoriert werden und der Optimierer sie fast automatisch extrem schlechten
Bewegungen zuweist, um Platz für die anderen zu machen). Also müssten wir
einen kompletten Korpus mit Hilfe eines Wörterbuches gewichten. Es gibt NLTK,
das könnte das vielleicht (natural language toolkit).

Das könnte allerdings recht viel Arbeit sein.

Hast du einen Link zu der Untersuchung?

Liebe Grüße,
Arne

--
singing a part of the history of free software:

- http://infinite-hands.draketo.de



signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Wolf Belschner
Am 31.05.2011 19:10, schrieb Arne Babenhauserheide:

 Als Vergleich: Qwertz hat eine Standardabweichung bei Wörtern von über 1200, 
 AdnW kommt über 1400, und Qwertz hat so Monster wie „zerfasert“ und 
 „gesondert“.

solche offensichtlichen Monster sind mir aber bei AdNW noch nicht
begegnet, irgendwas kann da immer noch nicht stimmen ???

Grüße

Wolf



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-31 Diskussionsfäden Peter Fischer

On 31.05.2011 19:18, Arne Babenhauserheide wrote:

Hast du einen Link zu der Untersuchung?

*auchhabenwill* :)

Peter




Re: [Neo] Wir brauchen den echten Korpus

2011-05-30 Diskussionsfäden Arne Babenhauserheide
On Monday 23 May 2011 07:18:15 Florian Janßen wrote:
 Arne Babenhauserheide schrieb am 22.05.2011 um 21:44 Uhr:
  On Saturday 21 May 2011 12:25:19 Florian Janßen wrote:
  Arne Babenhauserheide schrieb am 19.05.2011 um 08:26 Uhr:
  On Thursday 19 May 2011 08:16:43 Florian Janßen wrote:
  Im Corus? Weniger. Die Endauswahl kann man dann ja gegen einen
  rein
  englischen Korpus testen.
 
  Das habe ich mit bsi/pfu gemacht. Für Englisch kam die beste
  gerade mal auf 1,58 für Englisch. Bei Optimierung auf Englisch
  alleine komme ich auq 1,20 - da liegen Welten dazwischen.
 
  Worauf kommst du mit QWERTY?
 
  7,18 weil alles so doof ist wie in pfubsie y und eo

 Das belegt doch eindrucksvoll, dass eine Belegung, die auf einem rein
 deutscher Korpus fußt, auch im Englischen um Welt… äh … um Galaxien
 besser ist, als die Standardtastaturbelegung dieser Sprache.

Das ja, aber sie hat eben sehr unschöne Stellen. Und die fallen in einer
ansonsten optimierten Belegung sehr negativ auf - anders als bei QWETRY, das
einfach insgesamt unschön ist.

 Wenn es nicht zu viel Arbeit macht, kannst du sagen wo Dvorak US¹
 liegt?

And Dvorak

# Evolved Layout
’,.py fgcrl/aoeui dhtns-
;qjkx bmwvz

# 2.204216 x100 total penalty per letter
# 0.033347 x10 billion total penalty compared to notime-noeffort
# 5.735313 mean key position cost in file 1gramme.txt ( 0.08676893 )
# 6.374198 % finger repeats in file 2gramme.txt ( 0.0578606863091 )
# 0.027972 million keystrokes disbalance of the fingers ( 0.0111891308244 )
# 0.209172 % finger repeats top to bottom or vice versa ( 0.0064809984 )
# 1.329699 % of trigrams have no handswitching (after direction change counted
x 1 ) ( 0.0064296 )
# 0.004019 billion (rows²/dist)² to cross ( 0.0803948895172 )
# 0.068436 hand disbalance. Left: 0.43156337972 %, Right: 0.56843662028 % (
0.00621222060116 )
# 0.0 badly positioned shortcut keys (weighted).
# 0.031996 no handswitching after unbalancing key (weighted).
# 0.017061 movement pattern cost (weighted).
# 0.002734 asymmetric bigram cost (weighted).
# 0.018806 manually assigned bigram penalty (weighted)
# 0.007538 unbalancing key after neighboring finger (weighted)


Allerdings ist das ein Fall für „wer die Werte einfach undifferenziert als
Wertung der Belegung benutzt vereinfacht unzulässig, so dass seine Aussage
keine Aussagekraft mehr hat“.

Was dieser Test wieder belegt ist, dass der Tipptest die einzige wirklich
tragkräftige Wertung ist. Der Optimierer kann nie alle Parameter erfassen.

Allerdings kann er ein paar Hinweise geben, z.B. den hier: Wie gleichmäßig ist
das Tippgefühl, d.h. gibt es heftige Abweichungen?


!!! Achtung: Teils etwas unleserliche Codeschnipsel. !!!


QWERTZ: bäh! kosten ±1209 bei Worten, aber halt insgesamt schon so schlecht,
dass das nur ±275% sind

$ ./regularity_check.py  -t Korpora/Gutenberg/English/4899.txt.utf8  -n Qwertz

mean value and standard deviation of the layout cost:
snippets of 270 letters: 911.010599495 ± 333.462596187 (36.6035912614%)
words: 440.294592227 ± 1209.04850863 (274.599899697%)


DVORAK: Fast Faktor 3 besser bei Schnipseln und über Faktor 2 besser bei
Wörtern, aber größere relative Standardabweichung, weil die festen Werte
einfach so viel besser sind.

$ ./regularity_check.py  -t Korpora/Gutenberg/English/4899.txt.utf8  -l ’,.py
fgcrl/aoeui dhtns-
;qjkx bmwvz

mean value and standard deviation of the layout cost:
snippets of 270 letters: 352.701921689 ± 244.166805772 (69.227523514%)
words: 205.037967521 ± 715.448579425 (348.934681744%)


PFUBSIE: etwas besser als Dvorak. Höhere relative Abweichung bei Abschnitten,
absolut aber deutlich niedriger.

$ ./regularity_check.py  -t Korpora/Gutenberg/English/4899.txt.utf8  -l pfuo,
ßclmvqä
bsie. wtrnh⇘
kyöaü gdxjz

mean value and standard deviation of the layout cost:
snippets of 270 letters: 253.87993151 ± 183.484690556 (72.2722309967%)
words: 175.341368632 ± 546.501984656 (311.678863304%)


EASY: Das beste für genau den Korpus. Nochmal ~30% bis ~45% niedrigere
Standardabweichungen.

$ ./regularity_check.py  -t Korpora/Gutenberg/English/4899.txt.utf8  -l öuofk
zphlwä,
ieasy mtnrc⇘
.ßügx vdqjb

mean value and standard deviation of the layout cost:
snippets of 270 letters: 215.04338335 ± 123.634617547 (57.4928721923%)
words: 153.816528692 ± 278.440901013 (181.021443782%)


Und da es mich persönlich interessiert: AdnW:

$ ./regularity_check.py  -t Korpora/Gutenberg/English/4899.txt.utf8  -l kuü.ä
vgcljf´
hieao dtrnsß
xyö,q bpwmz

mean value and standard deviation of the layout cost:
snippets of 270 letters: 314.183907189 ± 342.393928555 (108.978824415%)
words: 227.746365673 ± 1716.90358917 (753.866514662%)


…das ist seltsam… Der Text und der Korpus von AdnW müssen verdammt große
Unterschiede haben oder die Bewertung unterscheidet sich deutlich…

Es ist auch hier besser als Dvorak, aber die Abweichungen sind heftig. Ich
teste nochmal gegen den Korpus von AdnW.


Qwertz:
snippets of 270 letters: 957.825201294 ± 422.314896543 (44.0910195276%)
words: 

Re: [Neo] Wir brauchen den echten Korpus

2011-05-28 Diskussionsfäden Cougarten
Wirklich eine tolle Idee!
Und bezüglich der Sprachen: wäre ein Keylogger nicht das beste? Er müsste ja
nur Zeichenpaare und Zeichen zählen und das nicht chronologisch.
Anschließend muss er schauen, ab wann sich in der Statistik nur noch wenig
tut und eine Analyse sinnvoll wäre.

liebe Grüße,
Leon

2011/5/28 Peter Fischer letzterfreiercoolern...@googlemail.com

 On 22.05.2011 21:23, Arne Babenhauserheide wrote:

 On Sunday 22 May 2011 16:33:57 Michael Gattinger wrote:

 Am 22.05.2011 16:02, schrieb Konrad Schultz:

 Diese Könnensstatistiken gibt es sicher, es kommt aber kaum auf das
 Können, sondern vielmehr auf das tatsächliche Schreiben an.

 Es ging mir mehr um eine Orientierung: Wenn 5% Italienisch können dann
 können nicht 6% Italienisch schreiben!

 → Orientierung für eine Obergrenze


 Vielleicht sollte Neo3 auch gar keine Tastaturbelegung  werden, sondern ein
 definierter Prozess, wie man zu seinem persönlich besten Layout kommt,
 gebündelt mit entsprechenden Howtos, wie man dieses persönlich beste Layout
 am besten auf einem Stick an andere Rechner transportiert und dort temporär
 anwendet.

 So gesehen brauchte man mehrere Korpora, deren Mischungsverhältnis man dann
 selber einstellen kann.

 Einen Sammeleinkauf für ergonomische, programmierbare und selbst
 beschriftbare Tastaturen (=Nobelvariante des Stick) könnte man noch
 anschließen.

 Peter




Re: [Neo] Wir brauchen den echten Korpus

2011-05-28 Diskussionsfäden Pascal Hauck
Am Samstag, 28. Mai 2011, 00:44:16 schrieb Peter Fischer:
 Vielleicht sollte Neo3 auch gar keine Tastaturbelegung  werden, sondern 
 ein definierter Prozess, wie man zu seinem persönlich besten Layout 
 kommt

Diese Idee kam schon öfters auf. Ich glaube jedoch, dass ein solcher Ansatz 
nicht zielführend ist.
Die Möglichkeit, einen eigenen Korpus zu wählen, eigene Bewertungen zu 
definieren etc. verlagert das Problem wieder auf den Anwender. Diejenigen, die 
daren wirklich ein Interesse haben, können das schon jetzt problemlos machen – 
z.B. durch Modifakation der Xmodmap, die strukturell einfacher ist.
Der Optimierer hebt den Sachverhalt zwar auf eine höhere Ebene, gerade das 
macht das Problem aber nicht einfacher!

Die Stärke von Neo besteht dagegen in zwei Punkten. Zum einen ist ein 
Ergebnis, das aus einer Diskussion in einer Gruppe entstanden ist, fast immer 
besser als das Ergebnis eines einzelnen – eventuell kann diese entstandene 
Belegung dann in kleinen Punkten auf individuelle Wünsche angepasst werden.
Zum anderen steht hinter der Belegung eine Gemeinschaft, die seit vielen 
Jahren bei Schwierigkeiten hilft und neue Benutzer anzieht. Zerfiele Neo in 
viele Projekte einzelner Anwender, würde auch diese Gemeinschaft zerbrechen, 
da die gemeinsame Grundlage fehlt – blos ein (anpassbarer) Optimierer und 
(austauschbarer) Korpus als Grund ist viel zu abstrakt.


Ich hoffe darum, dass es eine gemeinsame Neo3 geben wird,
Pascal



Re: [Neo] Wir brauchen den echten Korpus

2011-05-27 Diskussionsfäden Peter Fischer

On 22.05.2011 21:23, Arne Babenhauserheide wrote:

On Sunday 22 May 2011 16:33:57 Michael Gattinger wrote:

Am 22.05.2011 16:02, schrieb Konrad Schultz:

Diese Könnensstatistiken gibt es sicher, es kommt aber kaum auf das
Können, sondern vielmehr auf das tatsächliche Schreiben an.

Es ging mir mehr um eine Orientierung: Wenn 5% Italienisch können dann
können nicht 6% Italienisch schreiben!

→ Orientierung für eine Obergrenze


Vielleicht sollte Neo3 auch gar keine Tastaturbelegung  werden, sondern 
ein definierter Prozess, wie man zu seinem persönlich besten Layout 
kommt, gebündelt mit entsprechenden Howtos, wie man dieses persönlich 
beste Layout am besten auf einem Stick an andere Rechner transportiert 
und dort temporär anwendet.


So gesehen brauchte man mehrere Korpora, deren Mischungsverhältnis man 
dann selber einstellen kann.


Einen Sammeleinkauf für ergonomische, programmierbare und selbst 
beschriftbare Tastaturen (=Nobelvariante des Stick) könnte man noch 
anschließen.


Peter



Re: [Neo] Wir brauchen den echten Korpus

2011-05-22 Diskussionsfäden Michael Gattinger

Am 21.05.2011 15:42, schrieb Wolf Belschner:

Nun, jeder geht eben von seiner eigenen Lebens- und Erfahrungswelt aus.
Problem ist doch, dass wir nicht genau wissen was die Leute auf ihren
Tastaturen so schreiben, wir sind da auf Vermutungen angewiesen, oder
gibt es da Untersuchungen? Wir werden dem Problem auch nicht mit einer
Umfrage in der Neo-Gruppe näherkommen, zumindest wäre das bestimmt nicht
repräsentativ. Mein Anteil an englisch liegt noch immer so bei 30-40%,
war schon mal höher, aber das ist zugegeben auch nicht repräsentativ.
Schon bevor ich das laß fragte ich mich ob es eine große Statistik gibt 
welche anderen Sprachen deutsche zu welchem Anteil können.

Z.b.
99,% der Deutschen können Deutsch
75% der Deutschen können Englisch
25% der Deutschen können Französisch
5% der Deutschen können Polnisch
usw. usf.

Vielleicht könnte man auf Basis dieser Daten eine Entscheidung treffen.

Mit freundlichen Grüßen

Michael Gattinger



Re: [Neo] Wir brauchen den echten Korpus

2011-05-22 Diskussionsfäden Konrad Schultz


Am 22.05.2011 15:00, schrieb Michael Gattinger:
 Am 21.05.2011 15:42, schrieb Wolf Belschner:
 Nun, jeder geht eben von seiner eigenen Lebens- und Erfahrungswelt aus.
 Problem ist doch, dass wir nicht genau wissen was die Leute auf ihren
 Tastaturen so schreiben, wir sind da auf Vermutungen angewiesen, oder
 gibt es da Untersuchungen? Wir werden dem Problem auch nicht mit einer
 Umfrage in der Neo-Gruppe näherkommen, zumindest wäre das bestimmt nicht
 repräsentativ. Mein Anteil an englisch liegt noch immer so bei 30-40%,
 war schon mal höher, aber das ist zugegeben auch nicht repräsentativ.
 Schon bevor ich das laß fragte ich mich ob es eine große Statistik
 gibt welche anderen Sprachen deutsche zu welchem Anteil können.
 Z.b.
 99,% der Deutschen können Deutsch
 75% der Deutschen können Englisch
 25% der Deutschen können Französisch
 5% der Deutschen können Polnisch
 usw. usf.

 Vielleicht könnte man auf Basis dieser Daten eine Entscheidung treffen.

 Mit freundlichen Grüßen

 Michael Gattinger

Diese Könnensstatistiken gibt es sicher, es kommt aber kaum auf das
Können, sondern vielmehr auf das tatsächliche Schreiben an.
Gruß
Konrad




Re: [Neo] Wir brauchen den echten Korpus

2011-05-22 Diskussionsfäden Michael Gattinger

Am 22.05.2011 16:02, schrieb Konrad Schultz:

Am 22.05.2011 15:00, schrieb Michael Gattinger:

Schon bevor ich das laß fragte ich mich ob es eine große Statistik
gibt welche anderen Sprachen deutsche zu welchem Anteil können.
Z.b.
99,% der Deutschen können Deutsch
75% der Deutschen können Englisch
25% der Deutschen können Französisch
5% der Deutschen können Polnisch
usw. usf.

Vielleicht könnte man auf Basis dieser Daten eine Entscheidung treffen.

Mit freundlichen Grüßen

Michael Gattinger


Diese Könnensstatistiken gibt es sicher, es kommt aber kaum auf das
Können, sondern vielmehr auf das tatsächliche Schreiben an.
Gruß
Konrad

Es ging mir mehr um eine Orientierung: Wenn 5% Italienisch können dann 
können nicht 6% Italienisch schreiben!




Re: [Neo] Wir brauchen den echten Korpus

2011-05-22 Diskussionsfäden Arne Babenhauserheide
On Sunday 22 May 2011 16:33:57 Michael Gattinger wrote:
 Am 22.05.2011 16:02, schrieb Konrad Schultz:
  Diese Könnensstatistiken gibt es sicher, es kommt aber kaum auf das
  Können, sondern vielmehr auf das tatsächliche Schreiben an.
 Es ging mir mehr um eine Orientierung: Wenn 5% Italienisch können dann
 können nicht 6% Italienisch schreiben!

→ Orientierung für eine Obergrenze

signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-22 Diskussionsfäden Florian Janßen
Arne Babenhauserheide schrieb am 22.05.2011 um 21:44 Uhr:
 On Saturday 21 May 2011 12:25:19 Florian Janßen wrote:
 Arne Babenhauserheide schrieb am 19.05.2011 um 08:26 Uhr:
 On Thursday 19 May 2011 08:16:43 Florian Janßen wrote:

 Im Corus? Weniger. Die Endauswahl kann man dann ja gegen einen rein
 englischen Korpus testen.

 Das habe ich mit bsi/pfu gemacht. Für Englisch kam die beste 
 gerade mal auf 1,58 für Englisch. Bei Optimierung auf Englisch
 alleine komme ich auq 1,20 - da liegen Welten dazwischen.

 Worauf kommst du mit QWERTY?

 7,18 weil alles so doof ist wie in pfubsie y und eo

Das belegt doch eindrucksvoll, dass eine Belegung, die auf einem rein
deutscher Korpus fußt, auch im Englischen um Welt… äh … um Galaxien
besser ist, als die Standardtastaturbelegung dieser Sprache.

Wenn es nicht zu viel Arbeit macht, kannst du sagen wo Dvorak US¹
liegt?

Eine Fremdsprache im Korpus geht automatisch zu Lasten der deutschen
Sprachen und da bin ich dagegen.


Gruß Florian

¹
',.pyfgcrl/=\
aoeuidhtns-
;qjkxbmwvz






signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-21 Diskussionsfäden Peter Fischer

On 20.05.2011 23:41, Florian Janßen wrote:

Wolf Belschner schrieb am 20.05.2011 um 21:20 Uhr:



Eine moderne Belegung egal welcher Sprache sollte meiner Meinung
nach deswegen auch in Englisch brauchbar zu tippen sein.

Da stimme ich zu. Aber ich denke dass lässt sich durch Selektion unter
den besten mit rein deutschem Korpus errechneten Belegungen erreichen.

Ah! *Das* war der Satz, den mein Hirn gestern nicht zustandebrachte!
*unterschreib*

Servus,
Peter



Re: [Neo] Wir brauchen den echten Korpus

2011-05-21 Diskussionsfäden Wolf Belschner
Am 20.05.2011 23:41, schrieb Florian Janßen:

 Warum begrenzt du die Verwendung eine Tastatur aufs Internet oder auf
 das Geschäftsleben?

 Ich schreibe ungefähr soviel Spanisch wie Englisch, beides ist aber nur
 ein kleiner Bruchteil dessen was ich auf Deutsch verfasse.
 
 Ich bin der Überzeugung, dass nur ein vernachlässigbarer Anteil der
 täglich in Deutschland geschrieben Texte in einer Fremdsprache entsteht.
 Deshalb bin ich strikt dagegen Fremdsprachen in der Korpus aufzunehmen.

Nun, jeder geht eben von seiner eigenen Lebens- und Erfahrungswelt aus.
Problem ist doch, dass wir nicht genau wissen was die Leute auf ihren
Tastaturen so schreiben, wir sind da auf Vermutungen angewiesen, oder
gibt es da Untersuchungen? Wir werden dem Problem auch nicht mit einer
Umfrage in der Neo-Gruppe näherkommen, zumindest wäre das bestimmt nicht
repräsentativ. Mein Anteil an englisch liegt noch immer so bei 30-40%,
war schon mal höher, aber das ist zugegeben auch nicht repräsentativ.

 Eine moderne Belegung egal welcher Sprache sollte meiner Meinung
 nach deswegen auch in Englisch brauchbar zu tippen sein.
 
 Da stimme ich zu. Aber ich denke dass lässt sich durch Selektion unter
 den besten mit rein deutschem Korpus errechneten Belegungen erreichen.
 Bitte nicht vergessen, dass brauchbar hier vergleichbar mit QWERTY
 heißen muss. Wenn wir schlechter als QWERTY werden, wäre es wirklich
 nicht schön.

D'accord, besser als Qwerty sollte es dann schon sein. Wie das erreicht
wird ist mir im Prinzip egal.

Ich gehe nur von meiner sehr positiven Erfahrung mit AdNW aus das auf
einem 40/60 englisch-deutschen Korpus basiert und in beiden Sprachen
hervorragend zu tippen ist. Dahinter will ich eigentlich nicht mehr zurück.

Grüße

Wolf



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-20 Diskussionsfäden Florian Janßen
Peter Fischer schrieb am 19.05.2011 um 23:57 Uhr:

 Wahrscheinlich keines. Ich war nur dagegen, in den Korpus englisch
 einfließen zu lassen. 

Da bin ich auch gegen, abgesehen davon, dass in deutschen Korpora schon
ein guter Batzen (D)Englisch drin steckt.

Gruß Florian



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-20 Diskussionsfäden Wolf Belschner
Am 20.05.2011 15:09, schrieb Florian Janßen:

 Da bin ich auch gegen, abgesehen davon, dass in deutschen Korpora schon
 ein guter Batzen (D)Englisch drin steckt.

Es geht dabei nicht um das gelegentliche (D)englische Wort das in
Texten bzw im Korpus vorkommt sondern ums Schreiben in der englischen
Sprache. Wenn du die vielen th, gh, ea, oa, ct, ou, gh, ly, you usw.
tippen musst wirst du froh sein wenn das halbwegs flüssig abgeht, was
auf einer ausschließlich für Deutsch optimierten Belegung nicht
unbedingt gewährleistet sein wird. Da für die meisten Menschen die
heutzutage mit einer Tastatur Zeichen eingeben auch hin und wieder
englische Texte dabei sein werden (mit wahrscheinlich steigender
Tendenz), halte ich das für essentiell, anders wäre es an der Realität
vorbei konzipiert.

Grüße

Wolf



Re: [Neo] Wir brauchen den echten Korpus

2011-05-20 Diskussionsfäden Florian Janßen
Wolf Belschner schrieb am 20.05.2011 um 18:51 Uhr:
 Am 20.05.2011 15:09, schrieb Florian Janßen:
 
 Da bin ich auch gegen, abgesehen davon, dass in deutschen Korpora schon
 ein guter Batzen (D)Englisch drin steckt.
 
 Es geht dabei nicht um das gelegentliche (D)englische Wort das in
 Texten bzw im Korpus vorkommt sondern ums Schreiben in der englischen
 Sprache. Wenn du die vielen th, gh, ea, oa, ct, ou, gh, ly, you usw.
 tippen musst wirst du froh sein wenn das halbwegs flüssig abgeht, was
 auf einer ausschließlich für Deutsch optimierten Belegung nicht
 unbedingt gewährleistet sein wird.

Daher bin ich für dafür die besten Neo3-Finalisten auch nach anderen
Sprachen zu testen und dies in die Entscheidung mit einfließen zu lassen.


 Da für die meisten Menschen die heutzutage mit einer Tastatur Zeichen
 eingeben auch hin und wieder englische Texte dabei sein werden (mit
 wahrscheinlich steigender Tendenz), halte ich das für essentiell,
 anders wäre es an der Realität vorbei konzipiert.

Du hast 30% Englisch vorgeschlagen. Dann möchte ich gerne 8% Französisch
und je 5% Italienisch und Spanisch vorschlagen. Vielleicht noch geringe
Anteile Niederländisch, Türkisch, Polnisch, Dänisch, Ungarisch …
Da für die meisten Menschen werden heutzutage hin und wieder
fremdsprachige Texte dabei sein werden (mit wahrscheinlich steigender
Tendenz), halte ich das ebenfalls für essentiell, anders wäre es an der
Realität vorbei konzipiert.

Gruß Florian



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-20 Diskussionsfäden Wolf Belschner
Am 20.05.2011 20:13, schrieb Florian Janßen:

 Du hast 30% Englisch vorgeschlagen. Dann möchte ich gerne 8% Französisch
 und je 5% Italienisch und Spanisch vorschlagen. Vielleicht noch geringe
 Anteile Niederländisch, Türkisch, Polnisch, Dänisch, Ungarisch …
 Da für die meisten Menschen werden heutzutage hin und wieder
 fremdsprachige Texte dabei sein werden (mit wahrscheinlich steigender
 Tendenz), halte ich das ebenfalls für essentiell, anders wäre es an der
 Realität vorbei konzipiert.

Da geht jetzt aber der Sarkasmus etwas durch. Ich halte das für
überzogen, aber wenn's denn sein muss, ich habe kein Problem damit.

Nur, die Sprachen mit vielen anderen Accents sollten schon ihre eigene
Belegung bauen mit der sie dann in einem dominant englischen Internet
zurechtkommen, das wäre doch ein bißchen viel Aufwand für wenig Effekt
das alles in eine Belegung ‚für die deutsche Sprache’ integrieren zu wollen.

Ich sehe das eher unter praktischen Gesichtpunkten und nicht als eine
Sache der ‚political correctness’. Meine französischen und polnischen
Geschäftspartner verstehen und kommunzieren auch in Englisch wenn sie
von mir verstanden werden wollen und vice versa.

Englisch macht es deswegen einfach, weil es keine Akzente gibt und damit
weniger Buchstaben die auf der Tastatur zu verteilen sind. Außerdem ist
es sowas wie eine Standardsprache der globalisierten Weltökonomie. Eine
moderne Belegung egal welcher Sprache sollte meiner Meinung nach
deswegen auch in Englisch brauchbar zu tippen sein. Aber wenn jemand
einen kleinen Anteil Italienisch braucht, nichts dagegen einzuwenden,
kann wohl nicht schaden. ;)

Gruß

Wolf




Re: [Neo] Wir brauchen den echten Korpus

2011-05-20 Diskussionsfäden Florian Janßen
Wolf Belschner schrieb am 20.05.2011 um 21:20 Uhr:

 Nur, die Sprachen mit vielen anderen Accents sollten schon ihre eigene
 Belegung bauen mit der sie dann in einem dominant englischen Internet
 zurechtkommen, 

Die französischen Akzente sind mit Neo relativ gut zu erreichen und es
ist eine der Arbeitssprachen der EU. Es sprechen ca. 50% Englisch und
10% Französisch, warum also Französisch ausschließen?

Versteh mich nicht falsch ich bin gegen beides.

Warum begrenzt du die Verwendung eine Tastatur aufs Internet oder auf
das Geschäftsleben?

 Ich sehe das eher unter praktischen Gesichtpunkten und nicht als eine
 Sache der ‚political correctness’. Meine französischen und polnischen
 Geschäftspartner verstehen und kommunzieren auch in Englisch wenn sie
 von mir verstanden werden wollen und vice versa.

Ich schreibe ungefähr soviel Spanisch wie Englisch, beides ist aber nur
ein kleiner Bruchteil dessen was ich auf Deutsch verfasse.

Ich bin der Überzeugung, dass nur ein vernachlässigbarer Anteil der
täglich in Deutschland geschrieben Texte in einer Fremdsprache entsteht.
Deshalb bin ich strikt dagegen Fremdsprachen in der Korpus aufzunehmen.


 Eine moderne Belegung egal welcher Sprache sollte meiner Meinung
 nach deswegen auch in Englisch brauchbar zu tippen sein.

Da stimme ich zu. Aber ich denke dass lässt sich durch Selektion unter
den besten mit rein deutschem Korpus errechneten Belegungen erreichen.
Bitte nicht vergessen, dass brauchbar hier vergleichbar mit QWERTY
heißen muss. Wenn wir schlechter als QWERTY werden, wäre es wirklich
nicht schön.

 Aber wenn jemand
 einen kleinen Anteil Italienisch braucht, nichts dagegen einzuwenden,
 kann wohl nicht schaden. ;)

Natürlich schadet es. Es verschlechtert die Optimierung für die deutsche
Sprache, in der IMHO ca. 99,9% der täglich produzierten Texte entstehen.

Gruß Florian



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-19 Diskussionsfäden Florian Janßen
Peter Fischer schrieb am 19.05.2011 um 07:48 Uhr:
 On 19.05.2011 06:11, Arne Babenhauserheide wrote:
 Ich persönlich wäre für 70/30. Wie siehts bei euch aus?

Im Corus? Weniger. Die Endauswahl kann man dann ja gegen einen rein
englischen Korpus testen.

 … einem signifikanten Anteil Französisch, Flämisch,
 Niederländisch, an der Ostgrenze des deutschen Sprachraumes Sorbisch,
 Polnisch, Tschechisch, Slovakisch, Ungarisch, Slovenisch, und wenn man
 Neo für die ganzen Sprengsel der deutschen Sprachverteilung tauglich
 machen wollte, müsste man noch ein paar Ebenen einführen.

Was fehlt? Optimiert ist es sicherlich nicht, aber welche Zeichen
fehlen? Ich glaube, dass (fast) alle Zeichen des auf Basis des
lateinischen Alphabets direkt erreichbar sind.

Gruß Florian



signature.asc
Description: OpenPGP digital signature


Re: [Neo] Wir brauchen den echten Korpus

2011-05-19 Diskussionsfäden Arne Babenhauserheide
On Thursday 19 May 2011 08:16:43 Florian Janßen wrote:
  Ich persönlich wäre für 70/30. Wie siehts bei euch aus?

 Im Corus? Weniger. Die Endauswahl kann man dann ja gegen einen rein
 englischen Korpus testen.

Das habe ich mit bsi/pfu gemacht. Für Englisch kam die beste gerade mal auf
1,58 für Englisch. Bei Optimierung auf Englisch alleine komme ich auq 1,20 -
da liegen Welten dazwischen.

LG,
Arne
--
Unpolitisch sein
heißt politisch sein,
ohne es zu merken.
- Arne (http://draketo.de)




signature.asc
Description: This is a digitally signed message part.


Re: [Neo] Wir brauchen den echten Korpus

2011-05-19 Diskussionsfäden Michael Gattinger

Am 19.05.2011 06:11, schrieb Arne Babenhauserheide:

Hi,

Wie läuft die Arbeit am echten Korpus?

Der Test von Mœsi zeigt leider, dass spätere Auswahl für andere Sprachen nicht
klappt, d.h. wir brauchen etwas Englisch drin.

Ich persönlich wäre für 70/30. Wie siehts bei euch aus?

Liebe Grüße,
Arne
Nachdem ich im April große Worte spuckte, dass meine Software innerhalb 
von 2 Wochen fertigstellbar sei stellte sich herraus, dass ich dies doch 
nicht halten konnte. Mein Bruder hatte die Idee zu einer GUI, dessen 
Ausmaß ich damals noch nicht kannte. Und zu allem Überfluss kamen dann 
bei meinem Bruder die Jahres-Abschluss-Prüfungen.
Ich werd mal meinen Bruder anfragen ob wir den SVN Link Read - Only zur 
Besichtigung reinstellen.


Michael Gattinger



Re: [Neo] Wir brauchen den echten Korpus

2011-05-19 Diskussionsfäden Peter Fischer

On 19.05.2011 08:16, Florian Janßen wrote:

Peter Fischer schrieb am 19.05.2011 um 07:48 Uhr:


… einem signifikanten Anteil Französisch, Flämisch,
Niederländisch, an der Ostgrenze des deutschen Sprachraumes Sorbisch,
Polnisch, Tschechisch, Slovakisch, Ungarisch, Slovenisch, und wenn man
Neo für die ganzen Sprengsel der deutschen Sprachverteilung tauglich
machen wollte, müsste man noch ein paar Ebenen einführen.

Was fehlt? Optimiert ist es sicherlich nicht, aber welche Zeichen
fehlen? Ich glaube, dass (fast) alle Zeichen des auf Basis des
lateinischen Alphabets direkt erreichbar sind.
Wahrscheinlich keines. Ich war nur dagegen, in den Korpus englisch 
einfließen zu lassen. Dann würde m.E. unweigerlich ein 
Denglisch-Tastaturbelegung entstehen. Mit welcher Berechtigung sollte 
man Englisch in den Korpus einmischen, wenn man nicht seitenweise 
Manager-Deutsch verfassen wollte?


Gleiches gilt für andere Sprachen, s.u.

Der Satzteil für die ganzen Sprengsel der deutschen Sprachverteilung 
bezieht sich darauf, daß Deutsch eine der verbreitetsten 
Minderheitensprachen auf diesem Planeten ist, weil ausgewanderte 
Deutsche ihr Deutschsein auch nach mehreren Generationen nur schwer 
ablegen. Den Aufsatz wo ich das detailiert belegt gefunden habe, finde 
ich gerade nicht (ich habe jetzt 20 Minuten gesucht, ehrlich), aber 
kann mich daran noch erinnern, daß anhand der Bosporus-Deutschen darauf 
hingewesen wurde, daß Deutsche in Ankara seit Generationen ihr 
Deutschsein bewahren (und dürfen!) - etwas was zum Zeitpunkt des 
Erscheinens des Aufsatzes seitens diverser Politiker den Türken in 
Deutschland gerade ausgetrieben werden sollte. Und das machen auch 
andere deutsche ausgewanderte Gruppen in anderen Teilen dieser Welt.
Wollte man all diesen deutschsprachiger Exilpopulationen die nächste 
Neo-Variante durch gute Tippbarkeit des signifikaten Anteils der 
jeweiligen Nachbarsprache schmackhaft machen, dann hätte man auch andere 
Schriften zu unterstützen, ziemlich viele sogar, denn [1] ist sicher 
nicht vollständig.


M.E. kann ein Optimierer nur Vorschläge liefern, auswählen und gut 
finden muss es ein Mensch.


[1] 
http://de.wikipedia.org/wiki/Deutsche_Sprache#Verbreitung_der_deutschen_Sprache_weltweit 





Re: [Neo] Wir brauchen den echten Korpus

2011-05-18 Diskussionsfäden Peter Fischer

On 19.05.2011 06:11, Arne Babenhauserheide wrote:

Hi,

Wie läuft die Arbeit am echten Korpus?

Der Test von Mœsi zeigt leider, dass spätere Auswahl für andere Sprachen nicht
klappt, d.h. wir brauchen etwas Englisch drin.

Ich persönlich wäre für 70/30. Wie siehts bei euch aus?
Könnte man nicht einen Denglisch-Korpus aus Bundesbahnwerbung und 
Managerdeutsch dazumischen ;)

(EKNW)

Im Ernst: Bei mir wäre es ungefähr 50:50 - die habe ich aber bislang auf 
einer normalen dt. Tastaturbelegung geschrieben. Im Rheintal gibt es 
sicher Menschen mit einem signifikanten Anteil Französisch, Flämisch, 
Niederländisch, an der Ostgrenze des deutschen Sprachraumes Sorbisch, 
Polnisch, Tschechisch, Slovakisch, Ungarisch, Slovenisch, und wenn man 
Neo für die ganzen Sprengsel der deutschen Sprachverteilung tauglich 
machen wollte, müsste man noch ein paar Ebenen einführen.


Meiner Ansicht führte das in letzter Konsequenz zu einer EU- oder 
Halbe-Welt-Tastaturbelegung.


Und gerade Englisch kann man mit jeder Tastatur tippen, ist alphabetisch 
eine Untermenge der meisten anderen Sprachen.