On Thursday 16 June 2011 17:26:10 Michael Gattinger wrote:
> Am 11.06.2011 12:43, schrieb Arne Babenhauserheide:
> > https://bitbucket.org/ArneBab/1w6 ; 5MiB Text+HTML ) und es ist
> Ließt du die Sachen direkt aus dem Internet?

Ich klone das Repo erst:

        hg clone https://bitbucket.org/ArneBab/1w6

Dann habe ich es vollständig lokal.

> Desweiteren ist ja das Ziel,dass du dann irgendwann die Dateien nurnoch ein
einziges mal Analysierstund das Ergebnis abspeicherst und immer wieder
verwendest.

Das geht bisher schon.

> Da wir mit NEO rausfinden wollen welche Zeichen wie oft benutzt werdenist es
meiner Meinung nach unzulässig dann iso-Dateien einlesen zulassen.

Wieso? (ich mache es auch nicht, da bei mir fast alles in utf-8 ist, aber ein
paar alte Dateien sind halt doch noch drin, und die könnten eine Fehlerquelle
sein).

> bitte aberalle Eingabedateien UTF-8 zu codieren, ich habe auch nicht vor das
zuändern, weil ich keinen Sinn darin sehe.

Einen Sinn würde ich schon darin sehen (du machst ja die Aufbereitung in
deinem Prog, da gehört imho auch die Anpassung der Kodierung dazu; Das gahört
meiner Ansicht nach in die gleiche Kategorie wie regexp und suchen-ersetzen).

Vielleicht mit einer Kodierungsauswahl beim Öffnen.

Liebe Grüße,
Arne
--
singing a part of the history of free software:

- http://infinite-hands.draketo.de

Attachment: signature.asc
Description: This is a digitally signed message part.

Antwort per Email an