Delphi-PRAXiS
Seite 1 von 3  1 23      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Algorithmen, Datenstrukturen und Klassendesign (https://www.delphipraxis.net/78-algorithmen-datenstrukturen-und-klassendesign/)
-   -   Delphi Muss viele Strings vergleichen. Geschwindigkeit... (https://www.delphipraxis.net/193306-muss-viele-strings-vergleichen-geschwindigkeit.html)

DelTurbo 14. Jul 2017 10:27

Muss viele Strings vergleichen. Geschwindigkeit...
 
Hallo,
ich habe ein kleines Problem. Ich habe bis zu 2.000.000 Produkte in CSVDateien. Dort stehen Bestellnummern drin. Bestellnummern die mehrmals vorkommen muss ich zählen. Die Bestellnummern sind 10 Zeichen lang.

Da die Bestellnummern nur 10 Zeichen haben habe ich die in einer TStringlist. Das ist wesentlich schneller als THashedStringList habe ich festgestellt.

Nun zu meinem Problem. Je mehr Bestellnummern ich in der TStringlist habe um so langsamer wird das ganze. Ist ja auch logisch.

Ich Frage mit .IndexOf ob es die Bestellnummer schon gibt. Wenn nicht adde ich die. Hat vielleicht jemand eine andere Idee wie ich schneller abfragen könnte ob es die Nummer schon gibt?

Vielen dank im Voraus

Neutral General 14. Jul 2017 10:34

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Mit THashedStringList sollte ein IndexOf eigentlich schneller sein.
Falls du zufällig doch eine neuere Version als Delphi 2007 benutzt gäbe es da auch noch TDictionary<string, string> (bzw. <string, irgendwas>)

Uwe Raabe 14. Jul 2017 10:49

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Hast du bei der Stringlist nach dem Create
Delphi-Quellcode:
Sorted
auf true gesetzt? Wenn du dann noch
Delphi-Quellcode:
Duplicates
auf dupIgnore setzt, dann kannst du dir die Abfrage auf
Delphi-Quellcode:
IndexOf
auch sparen, da bei einem
Delphi-Quellcode:
Add
nur ein noch nicht vorhandener String zugefügt wird.

himitsu 14. Jul 2017 11:30

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Jupp, wenn StringList sortiert ist, dann nutzt IndexOf eine "optimierte" Suchfunktion,
wenn nicht, dann wird im Worst-Case jedes mal die komplette Liste durchgegangen (jeder einzelne String verglichen).

Mit eine Hashed-StringList muß nur nach dem Hash (Integer) gesucht werden, anstatt alle Strings als Byteweise zu vergleichen.

Das Dictinary ist erstmal sortiert und nutzt auch noch Hashs. (die Hashs sind natürlich sortiert)

Bernhard Geyer 14. Jul 2017 11:31

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Wir haben BTree-Implementierung im Einsatz die uns genau solche Suchen extrem beschleunigt.

bra 14. Jul 2017 11:41

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Zitat:

Zitat von Uwe Raabe (Beitrag 1376697)
Hast du bei der Stringlist nach dem Create
Delphi-Quellcode:
Sorted
auf true gesetzt? Wenn du dann noch
Delphi-Quellcode:
Duplicates
auf dupIgnore setzt, dann kannst du dir die Abfrage auf
Delphi-Quellcode:
IndexOf
auch sparen, da bei einem
Delphi-Quellcode:
Add
nur ein noch nicht vorhandener String zugefügt wird.

Er will ja gerade wissen, OB der Eintrag schon in der Liste war/ist.


Du könntest die TStringList sortieren und auf dupError setzen. Beim Add fängst du den Fehler ab und weißt, ob der Eintrag schon in der Liste war oder nicht.

himitsu 14. Jul 2017 12:14

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Add macht intern auch ein IndexOf (außer bei dupAccept und wenn nicht sortiert, wo er nicht zu prüfen/suchen braucht)

Das Tempo des IndexOf steckt also auch im Add drin.

freimatz 14. Jul 2017 12:18

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Aus meiner Sicht eindeutig: versuche es erst mal mit einem TDictionary<>. Ist wirklich "Delphi 2007 Architect" deine letzte Version? Bestell dir eine neuere oder such dir einen anderen Job.
BTree geht auch, ist aber nicht "out of the Box". Falls doch: auch ich habe auch eine Implementierung incl. hausinternen unit test.

Daniel 14. Jul 2017 12:35

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Zitat:

Zitat von freimatz (Beitrag 1376711)
Bestell dir eine neuere oder such dir einen anderen Job.

Also bitte? Was ist das denn für ein abartiger Kommentar? Man kann sich seine Werkzeuge eben nicht in jedem Projekt frei aussuchen. Du wirst das erkennen, sobald Du selbst ein wenig Lebens- und Praxiserfahrung gesammelt hast. Bis dahin wird man wohl nachsichtig mit Dir sein müssen. :roll:

Uwe Raabe 14. Jul 2017 12:37

AW: Muss viele Strings vergleichen. Geschwindigkeit...
 
Zitat:

Zitat von bra (Beitrag 1376706)
Er will ja gerade wissen, OB der Eintrag schon in der Liste war/ist.

Na ja, er will das wissen, um zu entscheiden, ob er den Eintrag hinzufügen soll oder nicht. Mit
Delphi-Quellcode:
dupIgnore
erübrigt sich das eben. Das macht intern nämlich genau das.

Zitat:

Zitat von DelTurbo (Beitrag 1376694)
Ich Frage mit .IndexOf ob es die Bestellnummer schon gibt. Wenn nicht adde ich die.



Alle Zeitangaben in WEZ +1. Es ist jetzt 09:05 Uhr.
Seite 1 von 3  1 23      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz