Einzelnen Beitrag anzeigen

bigg
(Gast)

n/a Beiträge
 
#30

Re: FileDup - identische Dateien in einem Ordner suchen

  Alt 3. Aug 2005, 12:21
moin hagen,

das ehrt mich jetzt aber .

Zitat von negah:
Einfach weil zb. EXE/DLL's immer den gleichen Header besitzen aber meistens am Ende andere Resourcen enthalten. Oder weil WinWord Dokumente mit höherer Wahrscheinlichkeit den gleichen Kopf besitzen aber unterschiedlicher Footer. Oder weil eine ZIP Datei am Anfang die gleichen Dateien gezippt haben könnte, deren ursprüngliche Inhalte aber unterschiedliche waren und somit im Laufe der Komprimierung am Ende der ZIP Datei andere Prüfsummen rauskommen. Die Wahrscheinlichkeit das zwei Dateien sich am Ende unterscheiden ist also größer als das sie sich am Anfang unterscheiden. Programmiertechnisch ist der Vergleich von Hinten nach Vorne kein großer Aufwand, Performancetechnisch reduziert sich aber die Laufzeit auf Grund der unterschiedlichen Wahrscheinlichkeiten.
Ich scanne mit absicht den Kopf, da ich so auch verwandte Dateien auffinden kann.
So könnte man auch den Dateityp ermitteln, ein sehr schoener nebeneffekt.

Aber da gebe ich dir recht, es ist wahrscheinlicher im hinteren Teil der Datei unterschiede zu entdecken.



Zitat:
Du vergleichst immer Stückchenweise beide Dateien solange sie gleich sind. Die Stückchen sind erst zb. 1024 Bytes groß, dann 1024*2 Bytes, dann 1024*4, 1024*8, 1024*16 usw. Bytes groß.
Ich könnte doch aber auch die Position in der Datei verschieben und dann meinen Puffer füllen.
So muesste ich seperat Speicher reservieren und das hatte ich eigentlich nicht vor.
  Mit Zitat antworten Zitat