Am 13.03.2011 17:59, schrieb Arne Babenhauserheide:
Aktuell würde ich die Parameter nun als gut einstufen. Was jetzt v.a. noch
fehlt ist ein passender Korpus: Wie soll die Verteilung auf Deutsch und
Englisch sein, und welche Texte nutzen wir? Sollen noch andere Sprachen rein
(Stichwort:
Am 14.03.2011 11:48, schrieb Arne Babenhauserheide:
Da brauche ich definitiv Hilfe - kann (und
will) ich nicht alleine entscheiden und kann es auch alleine nicht gut
genug stemmen, denke ich. Aufgabe: Freie Texte zusammenstellen,
zusammen so 100-300 MiB repräsentativen Text, gerne auch mehr.
Am 14.03.2011 18:24, schrieb Marco Antoni:
Dem möchte ich mich uneingeschränkt anschließen. [...][...][...]
Auch bei der Frage, welche Sprache dann einbezogen werden soll, kann
ich mir keine Einigkeit vorstellen. Klar ist Englisch die Weltsprache.
Aber Französisch-, Spanisch- und
Hi Michael,
On Monday 18 April 2011 02:10:16 Michael Gattinger wrote:
Am 14.03.2011 11:48, schrieb Arne Babenhauserheide:
Welche Syntax erfordern diese Typisierten Dateien?
Oder anders: Welche Infos stehen da drin?
Beispiel?
en 17,5%
er 12,3%
ar 5,7%
Da stehen einfach Häufigkeiten drin:
Hallo,
Ein praktisches Beispiel für die Schwächen (die inzwischen vom Optimierer
vermieden werden): „azyklischer Pfand“ („azyk“ ist sozusagen ein worst-case
Wort).
Apropos ‚worst-case Wort‘, bei Neo2 und vermutlich auch in deinem Layout ist
„Karlsruhe“ auffällig schwieriger zu tippen als in
Am 18.03.2011 09:24, schrieb Florian Janßen:
Nach dem man die richigen Knoten aus dem XML geladen hat (das kann sogar
ich ;) ) können Script-Junkies bestimmt ein paar schicke Regexen drauf
loslassen (kann ich nicht). Aber das ist wahrscheinlich genau das was
Karl mit „mehr Aufwand beim
Am 17.03.2011 23:54, schrieb Florian Janßen:
Am 16.03.2011 15:32, schrieb Peter Fischer:
Am 14.03.2011 18:41, schrieb Karl Köckemann:
Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr
Aufwand beim Strippen der Quelltexte erfordert.
[Link zu Wikipedia-XML-Dump]-
Hast du
Schubi schrieb am 18.03.2011 um 07:57 Uhr:
Am 17.03.2011 23:54, schrieb Florian Janßen:
Am 16.03.2011 15:32, schrieb Peter Fischer:
Am 14.03.2011 18:41, schrieb Karl Köckemann:
Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr
Aufwand beim Strippen der Quelltexte erfordert.
Am 16.03.2011 15:32, schrieb Peter Fischer:
Am 14.03.2011 18:41, schrieb Karl Köckemann:
Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr
Aufwand beim Strippen der Quelltexte erfordert.
[Link zu Wikipedia-XML-Dump]-
Hast du da mal reingeschaut? Das kann man noch nicht so
Arne Babenhauserheide schrieb am 14.03.2011 um 15:09 Uhr:
Dürfen wir ihn überhaupt nutzen?
Ich bin kein Jurist ;)
(Ja, ich weiß, dass Lizenzen nervig sein können. Ich kann aber nichts dafür,
dass die Uni-Leipzig so besch… Lizenzregeln aufstellt
Wahrscheinlich hat die Uni auch nicht so viel
On Monday 14 March 2011 17:32:06 Karl Köckemann wrote:
Vielen Dank für den wichtigen Hinweis!
Soeben habe ich in einer E-Mail and Uni Leipzig erfragt, ob sie Bedenken
haben oder eine Nutzungserlaubnis ausstellen würden. Warten wir die Antwort
ab.
Ich hoffe, sie sagen zu! Die Info „Optimiert
On 03/14/11 00:24, Pascal Hauck wrote:
Am Sonntag, 13. März 2011, 17:59:54 schrieben Sie:
[...]
Die Englische Sprache soll – in angemessen geringem (!) Umfang –
Berücksichtigung finden, der deutliche Schwerpunkt muss aber auf der Deutschen
Sprache liegen. Tatsächlich schreibt die Mehrheit doch
On Monday 14 March 2011 02:31:59 Florian Janßen wrote:
ich steh quasi vor dem gleichen Problem wie Pascal, ich bin nach Neo 2.0
für ne Zeit ausgestiegen, habe jetzt wieder Luft, weiß aber nicht genau
wie wo was gerade läuft.
Dann ein kurzes update: Ein paar Leute hier experimentieren mit
On 13.03.2011 17:59, Arne Babenhauserheide wrote:
Aktuell würde ich die Parameter nun als gut einstufen. Was jetzt v.a. noch
fehlt ist ein passender Korpus: Wie soll die Verteilung auf Deutsch und
Englisch sein, und welche Texte nutzen wir? Sollen noch andere Sprachen rein
(Stichwort:
Arne Babenhauserheide writes:
Wichtig: HAEIK ist nur für Testzwecke. Grund: Rein Deutscher Korpus und
veraltete Parameter. TNRS ist hat die richtigen Parameter, aber auch den rein
deutschen Korpus.
Beim Überarbeiten des Leizpiger Korpus für unsere Belange musste ich
feststellen: Rein
On Monday 14 March 2011 13:37:38 Karl Köckemann wrote:
Nachdem ich den Leipziger Korpus für unsere Belange überarbeitet habe,
scheue ich den Aufwand, weitere Korpora für weitere Sprachen anzugehen.
Wenn es um einen gemischtsprachigen Korpus ginge, würde ich mich sogar
weigern, da ich das für
Moin!
Dem möchte ich mich uneingeschränkt anschließen. Zitat aus dem Wiki: „Neo
– Die freie, für die deutsche Sprache ergonomisch optimierte
Tastaturbelegung“. Wie wir wissen, sind die europäischen Sprachen nicht
sooo verschieden, dass eine auf Deutsch optimierte Tastatur alle anderen
Arne Babenhauserheide writes:
On Monday 14 March 2011 13:37:38 Karl Köckemann wrote:
Nachdem ich den Leipziger Korpus für unsere Belange überarbeitet habe,
scheue ich den Aufwand, weitere Korpora für weitere Sprachen anzugehen.
Wenn es um einen gemischtsprachigen Korpus ginge, würde ich
Marco Antoni writes:
Zum Thema, wo man einen Korpus herbekommt:
http://www.gutenberg.org/wiki/Gutenberg:No_Cost_or_Freedom%3F und
http://www.gutenberg.org/wiki/German_Language_Books_(Bookshelf)
Lange Wikipediaartikel dürften z.B. auch geeignet sein.
Ohne jetzt erneut einen genaueren
Hi Pascal,
Aktuell tippe ich mit HAEIK/Salma 300 Zeichen pro Minute. Grundlegend tippt is
sich sehr schön, allerdings habe ich ein paar Probleme bemerkt - und sie in
den Optimierer einfließen lassen.
Wichtig: HAEIK ist nur für Testzwecke. Grund: Rein Deutscher Korpus und
veraltete Parameter.
On Sunday 13 March 2011 17:59:54 Arne Babenhauserheide wrote:
1) Die Belegung ist etwas unten-lastig. Dadurch ist die Grundstellung der
Zeigefinger zwischen der Grundstellung und der unteren Reihe und die Zahlen
sind weiter weg. → d
2) Wenn ich zwei nebeneinanderliegende Finger spreizen muss,
Am Sonntag, 13. März 2011, 17:59:54 schrieben Sie:
Wie soll die Verteilung auf Deutsch und
Englisch sein, und welche Texte nutzen wir? Sollen noch andere Sprachen
rein (Stichwort: Europäisches Layout)?
Meines Wissens haben bereits mehrere derjenigen, die sich mit dem Relevanz des
Korpus für
Hallo,
ich steh quasi vor dem gleichen Problem wie Pascal, ich bin nach Neo 2.0
für ne Zeit ausgestiegen, habe jetzt wieder Luft, weiß aber nicht genau
wie wo was gerade läuft.
Arne Babenhauserheide schrieb am 13.03.2011 um 17:59 Uhr:
TNRS ist hat die richtigen Parameter, aber auch den rein
23 matches
Mail list logo