Christian Kluge: > Karl Köckemann schrieb am 02.05.2010 23:31: > > 2gramme.mod.txt > > 3gramme.mod.txt > > 2grammetab.tab.mod.txt > > 3grammetab.tab.mod.txt > > Bei diesen Dateien ist leider ein kleiner Schönheitsfehler, es werden > auch Bi- und Trigramme mit Leerzeichen erstellt, ich glaube nicht, dass > dies Absicht war, oder?
Doch, das ist beabsichtigt. Die Bi- und Trigramme enthalten alle im Korpus vorkommenden Zeichen, also auch das Leerzeichen. Bei den Dateien, in deren Dateiname 'tab' vorkommt, sind die einzelnen Zeichen jedes Bi- bzw. Trigramms nicht zusammengeschrieben, sondern mit je einem Tabstop voneinander getrennt. Die Dateien erleichtern das Einlesen in und Arbeiten mit Tabellenkalkulationsprogrammen erheblich. Mit netten Grüßen Karl
