Einzelnen Beitrag anzeigen

Benutzerbild von negaH
negaH

Registriert seit: 25. Jun 2003
Ort: Thüringen
2.950 Beiträge
 
#31

Re: FileDup - identische Dateien in einem Ordner suchen

  Alt 3. Aug 2005, 13:09
Mein Vorschlag sollte dir eigentlich nur bewusst machen das ein "Stückchenhafter" Vergleich zweier Dateien in deinem Szenario nur überflüssige Rechenleistung kosten wird.

Die Methodik von D.J.Bernstein lohnt sich nur wenn bei jedem größer werdenden Vergleich die Komplexität eben nicht linear proportional ansteigt, sondern zb. expotentiell oder qudratisch, oder man mehrere Berechnungen über viele Daten in parallel durchführen kann. Beides trifft aber auf dein Problem nicht zu, und ergo ist es am besten beim binären Vergleich der Dateien die Dateien bis zum Ende hin in einem Rutsch zu vergleichen.


Du machst es doch nun so:

1.) vergleiche Dateigrößen, wenn ungleich Exit
2.) vergleiche beide Hash Prüfsummen, wenn ungleich Exit
3.) vergleiche die ersten 2048 Bytes, wenn ungleich Exit
4.) vergleiche die restlichen X Bytes bis zum Ende der Datei

Schritt 3.) ist absolut überflüssig und macht nur Sinn wenn entweder

a) zwischen Schritt 3.) und 4.) noch andere Dateien in parallel verglichen werden
b) die Komplexität des Vergleichsalgorithmus nicht linear proportional mit jedem zu vergleichenden Byte steigen würde. Sprich zb. bei jedem Byte verdoppelt sich die Laufzeit des Vergleichsalgos., die Komplexität würde also quadratisch mit jedem zu vergleichenden Byte ansteigen.

Gruß Hagen
  Mit Zitat antworten Zitat