Moin!
Dem möchte ich mich uneingeschränkt anschließen. Zitat aus dem Wiki: „Neo
– Die freie, für die deutsche Sprache ergonomisch optimierte
Tastaturbelegung“. Wie wir wissen, sind die europäischen Sprachen nicht
sooo verschieden, dass eine auf Deutsch optimierte Tastatur alle anderen
Sprachen untippbar sein lässt, eher im Gegenteil wird sie (vor allem im
Vergleich zu QWERTZ) auch dort teiloptimiert sein – das heißt, nicht
optimal, aber eben trotzdem gut. Unser Fokus sollte auf Deutsch liegen
(siehe Zitat), danach auf Erlernbarkeit (Ergonomie ohne User ist sinnlos)
und erst dann auf anderen Sprachen.
Auch bei der Frage, welche Sprache dann einbezogen werden soll, kann ich
mir keine Einigkeit vorstellen. Klar ist Englisch die Weltsprache. Aber
Französisch-, Spanisch- und Italienischsprecher gibt es auch viele und wie
lange Englisch diese Position behalten wird, ist auch unklar. Der kleinste
gemeinsame Nenner ist bei Neo die deutsche Sprache und auf diesen sollten
wir uns konzentrieren.
Zum Thema, wo man einen Korpus herbekommt:
http://www.gutenberg.org/wiki/Gutenberg:No_Cost_or_Freedom%3F und
http://www.gutenberg.org/wiki/German_Language_Books_(Bookshelf)
Lange Wikipediaartikel dürften z.B. auch geeignet sein.
Grüße, Marco8
Am 14.03.2011, 12:09 Uhr, schrieb Matthias Wächter
<matth...@waechter.wiz.at>:
On 13.03.2011 17:59, Arne Babenhauserheide wrote:
Aktuell würde ich die Parameter nun als gut einstufen. Was jetzt v.a.
noch
fehlt ist ein passender Korpus: Wie soll die Verteilung auf Deutsch und
Englisch sein, und welche Texte nutzen wir? Sollen noch andere Sprachen
rein
(Stichwort: Europäisches Layout)? Da brauche ich definitiv Hilfe - kann
(und
will) ich nicht alleine entscheiden und kann es auch alleine nicht gut
genug
stemmen, denke ich. Aufgabe: Freie Texte zusammenstellen, zusammen so
100-300
MiB repräsentativen Text, gerne auch mehr. Das geht vielleicht Michael
Gattinger an.
Ich würde, wie schon mehrfach vorgeschlagen, _keinen_
Mehrsprachen-Mischkorpus erstellen. Stattdessen sollte der Algorithmus
auf einen homogenen Korpus (Deutsch) losgelassen werden, und unter den
besten Layouts wählt man dann dasjenige aus, das weitere Kriterien
erfüllt, beispielsweise gute Werte mit anderen Korpora (Englisch, …)
oder einfache Erlernbarkeit.
– Mœsi