Christian Kluge:

> Karl Köckemann schrieb am 02.05.2010 23:31:
> > 2gramme.mod.txt
> > 3gramme.mod.txt
> > 2grammetab.tab.mod.txt
> > 3grammetab.tab.mod.txt
> 
> Bei diesen Dateien ist leider ein kleiner Schönheitsfehler, es werden
> auch Bi- und Trigramme mit Leerzeichen erstellt, ich glaube nicht, dass
> dies Absicht war, oder?

Doch, das ist beabsichtigt. Die Bi- und Trigramme enthalten alle im Korpus
vorkommenden Zeichen, also auch das Leerzeichen.

Bei den Dateien, in deren Dateiname 'tab' vorkommt, sind die einzelnen Zeichen
jedes Bi- bzw. Trigramms nicht zusammengeschrieben, sondern mit je einem Tabstop
voneinander getrennt. Die Dateien erleichtern das Einlesen in und Arbeiten mit
Tabellenkalkulationsprogrammen erheblich.

Mit netten Grüßen
Karl



Antwort per Email an