AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Win32/Win64 API (native code) Delphi Optimierung Code / Alternative zu Stringlist? (Delphi 5)
Thema durchsuchen
Ansicht
Themen-Optionen

Optimierung Code / Alternative zu Stringlist? (Delphi 5)

Ein Thema von frieder2008 · begonnen am 15. Mär 2011 · letzter Beitrag vom 17. Mär 2011
Antwort Antwort
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#1

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:07
BTree oder HashMap dürften viel schneller sein.

TStringList wird auch schneller wenn sie sortiert ist.
Danke für das Feedback. Sortierung hat in der Tat schon mal was gebracht, aber immer noch zu langsam. Die Sache mit den Hash-Maps verstehe ich nicht ganz. Wie funktioniert das Prinzip bzw. wie kann ich das auf mein Problem übertragen?

- Die 7 Mio Einträge resultieren aus einem großen Textkorpus mit ~11000 Texten, tokenisiert. Da kann ich schlecht einen Teil 'auslagern'

Danke und Gruß,
frieder
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.880 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:14
Ein HashMap ist ein Art Index der auf HashWerten der Daten basiert
Markus Kinzler
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#3

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:15
zum einen würde ich Dir für das Suchen die Binäre Suche empfehlen, zum anderen, wenn ich das richtig gesehen habe, dann fügst Du nicht vorhandene Datensätze ein, wie wäre es dann mit:
Delphi-Quellcode:

zielliste.Sorted:=true;
zielliste.Duplicates:=Dupignore;
{not found}
zielliste.add(quellliste[i]);
Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
ele

Registriert seit: 18. Feb 2009
129 Beiträge
 
Delphi 2010 Professional
 
#4

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:21
Es gibt da auch noch die THashedStringList, aber ich weiss nicht ab welcher Delphi-Version.
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#5

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:29
Es gibt da auch noch die THashedStringList, aber ich weiss nicht ab welcher Delphi-Version.
Das wäre es wohl! In D5 gibts das leider nicht. Hat jemand das dazugehörige Script (im Netz find ich jetzt spontan nichts, nur Hinweise, dass es das geben soll)?

Danke und Gruß,
frieder
  Mit Zitat antworten Zitat
RaSoWa1

Registriert seit: 1. Jun 2006
Ort: Halle/Saale
140 Beiträge
 
Delphi 2010 Professional
 
#6

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:55
Bei langen Stringlisten verwende ich zum Suchen nicht "IndexOf".
Folgender Code ist bei mir viel schneller (warum auch immer?):
Delphi-Quellcode:
function InLst(lst: TStrings; s: String): Integer;
var i : Integer;
begin
  result := -1;
  for i := 0 to lst.Count - 1 do
    if lst[i] = s then
    begin
      result := i;
      Break;
    end
end;
Gruß
Klaus
Klaus
  Mit Zitat antworten Zitat
ele

Registriert seit: 18. Feb 2009
129 Beiträge
 
Delphi 2010 Professional
 
#7

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 17:39
Das liegt vermutlich daran, dass bei Nachfahren von TStrings die virtuelle Methode CompareStrings aufgerufen wird, das ist etwas langsamer als ein direkter Stringvergleich...

Delphi-Quellcode:
function TStrings.IndexOf(const S: string): Integer;
begin
  for Result := 0 to GetCount - 1 do
    if CompareStrings(Get(Result), S) = 0 then Exit;
  Result := -1;
end;
  Mit Zitat antworten Zitat
Benutzerbild von BUG
BUG

Registriert seit: 4. Dez 2003
Ort: Cottbus
2.094 Beiträge
 
#8

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 18:26
Nur so ne Überlegung...

Gibt es eine Chance alle verschieden Tokens einfach durchgehend zu nummerieren?

Zumindest die Vergleiche könnten schneller werden, wenn man nur noch die Indices vergleicht und vielleicht wird nebenbei auch der Speicherverbrauch kleiner (je nachdem wie viele Strings doppelt vorkommen).
Intellekt ist das Verstehen von Wissen. Verstehen ist der wahre Pfad zu Einsicht. Einsicht ist der Schlüssel zu allem.
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#9

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:25
zum einen würde ich Dir für das Suchen die Binäre Suche empfehlen, zum anderen, wenn ich das richtig gesehen habe, dann fügst Du nicht vorhandene Datensätze ein, wie wäre es dann mit:
Delphi-Quellcode:

zielliste.Sorted:=true;
zielliste.Duplicates:=Dupignore;
{not found}
zielliste.add(quellliste[i]);
Gruß
K-H
Wenn ich richtig verstehe, fallen die Duplikate für die Zählung dann aber raus. - Das wäre kontraproduktiv.. Oder hab ich was falsch verstanden?

Gruß, frieder
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#10

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:51
Wenn ich richtig verstehe, fallen die Duplikate für die Zählung dann aber raus. - Das wäre kontraproduktiv.. Oder hab ich was falsch verstanden?
Nicht Du, ich
(man könnte vllt. dupError nutzen und dann in der Exceptionbehandlung zählen..??)
[bitte nicht schlagen!]
Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:21 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz