![]() |
Dateien in einem Ordner rekursiv in parallelem Task zählen
Hallo!
Ich habe mir eine Routine geschrieben, die rekursiv die in einem Ordner enthaltenen Dateien in einem parallelen Task zählt:
Delphi-Quellcode:
Was haltet ihr davon? Könnte man das noch weiter optimieren?
uses
System.Threading; procedure TForm1.CountFilesTask(const ADir: string); var ThisTask: ITask; begin ThisTask := TTask.Create( procedure() var count: Integer; procedure FileSearch(const ThisDir: string); var SR: TSearchRec; begin if FindFirst(IncludeTrailingPathDelimiter(ThisDir) + '*', faAnyFile, SR) = 0 then begin try repeat if (SR.Attr and faDirectory) = 0 then begin Inc(Count); TThread.Synchronize(nil, procedure begin lblShowFilesCount.Caption := IntToStr(count) + ' files'; end); end else if (SR.Name <> '.') and (SR.Name <> '..') then begin FileSearch(IncludeTrailingPathDelimiter(ThisDir) + SR.Name); end; until FindNext(SR) <> 0; finally FindClose(SR); end; end; end; begin CodeSite.Send('VOR Suche'); FileSearch(ADir); CodeSite.Send('NACH Suche'); end); ThisTask.Start; end; procedure TForm1.btnStartCountClick(Sender: TObject); begin CountFilesTask(Trim(edtDirectory.Text)); end; |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Bei jeder einzelnen Datei ein TThread.Synchronize ... da kann man das alles auch gleich im Hauptthread belassen, so oft wie der Code dort vorbeikommt. :stupid:
![]() |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Oder man sendet eine Message. da nur ein Integer übergeben wird, würde sich das auch noch anbieten.
Gruß K-H |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Für jede Datei eine Message .... quasi die selbe Ausführungsdauer
Man kann z.B. Verzeichnisweise sammeln, oder per GetTickCount nur alle nach jeweils frühestens x Sekunden/Millisekunden oder ![]() ![]() z.B.:
Delphi-Quellcode:
Counter := 0;
for i := 0 to 10000 do begin Inc(Counter); Label1.Caption := IntToStr(Counter); Application.ProcessMessage; end;
Delphi-Quellcode:
Counter := 0;
for i := 0 to 10000 do begin Inc(Counter); if i mot 1000 then begin Label1.Caption := IntToStr(Counter); Application.ProcessMessage; end; end; |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
TThread.Queue für die Ausgabe & die Timer Idee
Und natürlich nicht nur einen Task nehmen... Sondern direkt mal für jedes Unterverzeichnis einen Und wenn Du schon durch läuft dann optional die Dateinamen in Listen speichern.. Oder eine Bestimmte Datei in allen Unterverzeichnissen suchen... Am besten eine Factory mit übergeben, was im Dir gemacht werden soll... Mavarik |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Bei einer "meschanischen" Festplatte wird es mittels mehrerer Threads nur langsamer. :stupid:
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
Abgesehen davon NEIN! Das kannst Du nicht so pauschal sagen... Nur wenn der Kopf wild über die Platte Seeken muss... Wenn aber z.B. 5 Dir's auf der gleichen Spur sind, kann Windows mit einer Festplattenumdrehung parallel lesen... ggf. ist das Dir auch im Cache! |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Die Chanche, daß zur selben Zeit die Verzeichnisse auf der selben Spur liegen, ist extrem gering.
Dazumal sind auch "größere" Verzeichnisse schnell mal fragmentiert und liegen dann nichtmal selber auf einer Spur. Auch SSDs sind nicht unbedingt schneller, wenn man parallel arbeitet, gegenüber der sequentiellen Bearbeitung. Wenn man noch etwas beim Auslesen/Suchen machen würde, das in jedem Thread zusätzlich parallel läuft, aber natürlich nur in CPU/RAM, dann kann man schon was mit Threads machen. Am Schnellsten ginge es z.B. direkt über die MFT (NTFS). |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
Delphi-Quellcode:
und wenn man durch ist, auch noch eine Message mit dem Endstand.
if cnt and $0F = 0 then ....
Was die Performance angeht, mal ist's schneller, mal langsamer (Harddisk und NetzLaufwerke). Die Aufteilung bringt auf jeden Fall etwas (nach meinen Erfahrungen) wenn man parallel auf phys. unterschiedliche Laufwerke zugreift. Gruß K-H |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Getestet: Wenn ich das Synchronize raus nehme, ist meine Routine bei 2 Millionen Dateien um über 20% schneller als TDirectory.GetFiles. (Cachung berücksichtigt, Durchschnittswert bei mehreren Suchen): 2 Millionen Dateien in 33 Sekunden.
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
Nur im klassischen alter PC Window98 MFM Festplatte... Da magst Du recht habe... Auch das wäre zu testen... Mein Windows läuft in der VM... Ein großer Teil davon ist im RAM des Hosts... Alle Dirs sind in einer Datei... Und schon hast Du andere Bedingungen... SSD mit 8GB Cache Controller... da ist noch mehr im RAM... Aber wir können ja mal ein Test machen... |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Es hat zumindestens den Vorteil, daß man Schleife und Rekursion nicht selber zusammenbauen muß. (auch wenn es teilweise echt besch* gebaut ist)
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
Was wäre so die OPTIMALE VM-Konfiguration? |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
Also... 18,5 Mio Dateien in der VM C:\ Deine Routine zwischen 20-22 Sekunden... 28-30% CPU Last auf 4 Cores... Meine Routine N Task's 90% CPU Last 6.5 - 7.2 Sekunden... Außerhalb der VM (12 Kerne) Deine Routine 32 Sekunden! Meine Routine 2,9 Sekunden! Hochgerechnet auf 18. Mio da ich da nicht so viele Dateien habe... Wo bei das schon in den Bereich des Messfehlers fällt da schneller als eine halbe Sekunde! 450-550 ms für 336337 Dateien Das geht jedoch so schnell, dass die Anzeige der Kerne gar keine Zeit hat auf 100% zu springen... :-) Mavarik |
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Ist der i6 eigentlich ein gepimpter i5 oder ein kastrierter i7? :stupid:
|
AW: Dateien in einem Ordner rekursiv in parallelem Task zählen
Zitat:
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 05:08 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz