AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Win32/Win64 API (native code) Delphi Optimierung Code / Alternative zu Stringlist? (Delphi 5)
Thema durchsuchen
Ansicht
Themen-Optionen

Optimierung Code / Alternative zu Stringlist? (Delphi 5)

Ein Thema von frieder2008 · begonnen am 15. Mär 2011 · letzter Beitrag vom 17. Mär 2011
Antwort Antwort
Seite 1 von 3  1 23      
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#1

Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 15:31
Liebe Leute,

ich habe eine Liste mit mehr als 7 Mio Einträgen (Strings/einzelne Wörter), die ich gerne gruppieren und zählen würde.

Derzeit habe ich das mit einer Stringlist realisiert:

Delphi-Quellcode:
Procedure GruppiereZaehleListe(Quellliste, Ziellist: tstringlist);
var
  i: integer;
  CurIndex: integer;
begin

  for i:= 0 to Quellliste.count-1 do
    begin
      CurIndex := Ziellist.IndexOf(Quellliste[i]);
      if CurIndex >= 0 then
        Ziellist.Objects[CurIndex] := TObject(Succ(Integer(Ziellist.Objects[CurIndex])))
      else
        Ziellist.AddObject(Quellliste[i], TObject(1));
    end;
end;
Mein Problem: Das ist VIEL zu langsam. Gibt es irgendeine Möglichkeit, den Code zu optimieren oder eine Alternative zu TStringlist, die einfach schneller arbeitet?

- Habe nur D5 zur Verfügung (ich weiß, alt).

Danke und beste Grüße,
frieder
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.170 Beiträge
 
Delphi 10.4 Sydney
 
#2

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 15:44
BTree oder HashMap dürften viel schneller sein.

TStringList wird auch schneller wenn sie sortiert ist.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#3

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 15:46
Eventuell sollte man sich auch über die 7 Mio Einträge Gedanken machen.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#4

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:07
BTree oder HashMap dürften viel schneller sein.

TStringList wird auch schneller wenn sie sortiert ist.
Danke für das Feedback. Sortierung hat in der Tat schon mal was gebracht, aber immer noch zu langsam. Die Sache mit den Hash-Maps verstehe ich nicht ganz. Wie funktioniert das Prinzip bzw. wie kann ich das auf mein Problem übertragen?

- Die 7 Mio Einträge resultieren aus einem großen Textkorpus mit ~11000 Texten, tokenisiert. Da kann ich schlecht einen Teil 'auslagern'

Danke und Gruß,
frieder
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.851 Beiträge
 
Delphi 11 Alexandria
 
#5

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:14
Ein HashMap ist ein Art Index der auf HashWerten der Daten basiert
Markus Kinzler
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#6

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:15
zum einen würde ich Dir für das Suchen die Binäre Suche empfehlen, zum anderen, wenn ich das richtig gesehen habe, dann fügst Du nicht vorhandene Datensätze ein, wie wäre es dann mit:
Delphi-Quellcode:

zielliste.Sorted:=true;
zielliste.Duplicates:=Dupignore;
{not found}
zielliste.add(quellliste[i]);
Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
ele

Registriert seit: 18. Feb 2009
129 Beiträge
 
Delphi 2010 Professional
 
#7

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:21
Es gibt da auch noch die THashedStringList, aber ich weiss nicht ab welcher Delphi-Version.
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#8

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:25
zum einen würde ich Dir für das Suchen die Binäre Suche empfehlen, zum anderen, wenn ich das richtig gesehen habe, dann fügst Du nicht vorhandene Datensätze ein, wie wäre es dann mit:
Delphi-Quellcode:

zielliste.Sorted:=true;
zielliste.Duplicates:=Dupignore;
{not found}
zielliste.add(quellliste[i]);
Gruß
K-H
Wenn ich richtig verstehe, fallen die Duplikate für die Zählung dann aber raus. - Das wäre kontraproduktiv.. Oder hab ich was falsch verstanden?

Gruß, frieder
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#9

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:29
Es gibt da auch noch die THashedStringList, aber ich weiss nicht ab welcher Delphi-Version.
Das wäre es wohl! In D5 gibts das leider nicht. Hat jemand das dazugehörige Script (im Netz find ich jetzt spontan nichts, nur Hinweise, dass es das geben soll)?

Danke und Gruß,
frieder
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#10

AW: Optimierung Code / Alternative zu Stringlist? (Delphi 5)

  Alt 15. Mär 2011, 16:51
Wenn ich richtig verstehe, fallen die Duplikate für die Zählung dann aber raus. - Das wäre kontraproduktiv.. Oder hab ich was falsch verstanden?
Nicht Du, ich
(man könnte vllt. dupError nutzen und dann in der Exceptionbehandlung zählen..??)
[bitte nicht schlagen!]
Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 3  1 23      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 04:32 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz