Am Freitag, 8. Juli 2005 00:58 schrieb Michael Bischof:
> >
> > Höchstens wenn es vom Dateiformat z.B. bmp in der Datei
> > selbst definiert wird. (siehe dazu den Wikipedia Link von Denny
> > zu dem Magic Numbers).
> >
> > Die einzige Chance den Dateityp zu erkennen ist reinzuschauen
> > (cat oder hex editor) und schauen ob man etwas bekanntes sieht.
>
> Danke, Benny ! Ich habe das mal irgendwann bei einer ausführbaren Datei
> gesehen - dachte ich wenigstens. Vielleicht verwechele ich das auch mit
> den Vorspannen von Dateien, etwa in der Art:
Du hast schon richtig gedacht: bei vielen Formaten werden am Anfang der Datei 
Parameter abgelegt. Allerdings sind dies meistens Parameter für einen 
bestimmten Dateityp und nicht für die Erkennung desselben gedacht.

Übrigens gab es einmal ein standardisiertes Dateiformat, das die interne 
Struktur einer Datei formal vorgab: IFF. Es wurde von Electronic Arts 
entwickelt und ist durch IFF ILBM als Amiga-Bilddateiformat bekannt geworden. 
Dort stand tatsächlich im Header: ich bin ein Bild vom Typ ... oder ich bin 
ein Soundfile vom Typ ..., etc.

Textdateien sind eine Sonderform, da sie nicht sonderlich interpretiert werden 
müssen, sondern Byte für Byte verwendet werden. Leider trifft das praktisch 
für alle Dateitypen zu, bei einem Bild als Textdatei ausgegeben kommt halt 
nur Müll heraus. Aber was versteht der Computer schon davon, ober er gerade 
Goethe oder Zeichenwirrwarr ausgibt. Außer einer Analyse der verwendeten 
Zeichen, d.h die ersten 127 Bit des ASCII-Codes, die außerdem z.B. auch im 
MIME-Format auftreten können, bleibt also nur noch die Methode Rest: wenn 
kein Format erkannt wird, wird es also ein Text sein...

Obwohl ich schon viel geschrieben habe, reicht dieses Thema bestimmt für viele 
Doktor- oder Diplomarbeiten, also erhebe ich keinen Anspruch auf 
Vollständigkeit.

Gruss
Silvério
-- 
----------------------------------------------------------------------------
PUG - Penguin User Group Wiesbaden - http://www.pug.org

Antwort per Email an