AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein GUI-Design mit VCL / FireMonkey / Common Controls Delphi IndexOf case sensitive / Performance verbessern
Thema durchsuchen
Ansicht
Themen-Optionen

IndexOf case sensitive / Performance verbessern

Ein Thema von frieder2008 · begonnen am 7. Mär 2009 · letzter Beitrag vom 8. Mär 2009
Antwort Antwort
Seite 1 von 2  1 2      
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#1

IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 13:20
Hallo Leute,

folgende zwei 'Probleme' habe ich, wo ich gerade hänge bzw. wo mein Delphi am Ende ist:

1) Ich vergleiche zwei Stringlisten (mit Tokens) miteinander und zähle die verschiedenen Tokens darin. Das mache ich bisher so (und klappt wunderbar):

Delphi-Quellcode:
      for iii:=0 to tokenlist.Count -1 do
        begin
          occurindex:= tokenlistges.indexof(tokenlist[iii]);
          if occurindex >=0 then
            tokenlistges.Objects[occurindex]:= TObject(Succ(Integer(tokenlistges.Objects[OccurIndex])))
            else tokenlistges.AddObject(tokenlist[iii],TObject(1));
        end;
Aber: Leider zählt mein Code so case insensitive, sprich "Das" und "das" werden zusammengenommen. Gibt es eine Möglichkeit, IndexOf case sensitive zu stellen (D5!)? - Oder hat jemand eine Idee, wie ich das alternativ umsetzen könnte? (Ich habe es mit einer verschachtelten Routine und CompareAnsiStr probiert, aber dann zählt er "Das" korrekt und "das" wird für jeden Fund in die Liste (tokenlistges) eingetragen, anstatt einen entsprechenden Eintrag zu hochzuzählen..)

2) Zweite Sache: Ich bastle gerade an einem Textanalyseprogramm mit verschiedenen Routinen. Funktionieren tut alles soweit, aber die Performance lässt vor allem bei großen Textmengen (>1 Mio Wortformen/Tokens) sehr zu wünschen übrig. Gibt es eine Möglichkeit, mit der ich die Performance verbessern kann, an einer der folgenden Stellen:

- Textfiles laden
- jedes Textfile für sich in eine Token-String-List konvertieren (Extractstrings..)
- Tokens des Textfile mit den Tokens weiterer Textfiles in einer Liste zählen
- Frequenzliste in Listview ausgeben

* Ich arbeite derzeit v.a. mit Stringslists; gibts da evtl. eine schnellere Lösung o.ä.?
* Oder ließen sich die Textfiles irgendwie vorverarbeiten/vorspeichern, so dass sie schneller gelesen werden können?
* Ein anderes Programm, das das schon kann, was ich gerade baue, arbeitet anscheinend viel mehr mit der Festplatte (zumindest zeigt das die Leuchte); bei mir tut sich im Vergleich dazu gar nix, aber es dauer gerade bei großen Textmengen ewig.. Ist es etwa schneller, mit der Platte anstatt mit dem Arbeitsspeicher zu schaffen?!? - Wenn ja, wie?

Danke für Eure Mühe und viele Grüße zum WE,
frieder
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#2

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 13:30
Wie wäre es damit:
UpperCase(occurindex) := tokenlistges.indexof(UpperCase(tokenlist[iii]));
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.171 Beiträge
 
Delphi 10.4 Sydney
 
#3

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 13:32
zu: Schon probiert mit einer Sortierten Liste zu arbeiten (.Sorted := True). Ansonsten solltest du dich mal mit B-Trees auseinandersetzen.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#4

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 13:35
danke; aber Luckies Vorschlag kapier' ich nicht: Uppercase konvertiert mir doch beides in Großbuchstaben, sprich, es ist dann erst recht case insensitive, oder?
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.152 Beiträge
 
Delphi 12 Athens
 
#5

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 13:58
IndexOf verwentet intern CompareStrings und diese Funktion nutzt AnsiCompareText ... also CaseInsensitive.

Leite die Klasse (TStringList?) ab und überschreib CompareStrings (dieses ist virtual) mit einer eigenen Funktion.

Delphi-Quellcode:
function {TStrings}.CompareStrings(const S1, S2: string): Integer;
begin
  Result := AnsiCompareStr(S1, S2);
end;
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#6

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 14:26
Uff, sorry, da komme ich als relativer Anfänger nicht mit, weil noch nie Klassen abgeleitet, geschweige denn Methoden überschrieben. Ich habe versucht, mich dazu ein bisschen einzulesen, aber ich verstehe nicht, wie ich die Funktion (in dem Fall comparetext) überschreiben soll.

Delphi-Quellcode:
type
  TFstringlist = class(Tstringlist);
  private
  function CompareStrings(const S1, S2: string): Integer; override;
  end;
So krieg ich eine Fehlermeldung, weil Comparestrings der Basisklasse nicht bekannt sei..
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.152 Beiträge
 
Delphi 12 Athens
 
#7

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 14:36
also bei mir geht das (selbst mit der "falschen" Sichbarkeit > Private)

Delphi-Quellcode:
Uses Classes;

Type
  TMyStringsList = Class(TStringList)
  Protected
    Function CompareStrings(Const S1, S2: String): Integer; Override;
  End;

Function TMyStringsList.CompareStrings(Const S1, S2: String): Integer;
  Begin
    Result := AnsiCompareStr(S1, S2);
  End;

ach ja, falls es wen interessiert, es wurde natürlich in der Basisklasse deklariert:
(ist also bei allen Nachkommen von TStrings so änderbar)
Delphi-Quellcode:
TStrings = Class(TPersistent)
Protected
  Function CompareStrings(Const S1, S2: String): Integer; Virtual;
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
frieder2008

Registriert seit: 28. Feb 2009
78 Beiträge
 
#8

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 15:01
Sorry, ich kriegs einfach nicht hin: Die Fehlermeldung bleibt "Comparestrings" sei nicht in der Basisklasse.
Delphi-Quellcode:
unit frisstrings;

interface

uses classes;

Type
  TMyStringsList = Class(TStringList)
  Protected
    Function CompareStrings(Const S1, S2: String): Integer; Override;
  End;

implementation

Function TMyStringsList.CompareStrings(Const S1, S2: String): Integer;
  Begin
    Result := AnsiCompareStr(S1, S2);
  End;

end.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.152 Beiträge
 
Delphi 12 Athens
 
#9

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 15:32
Welche Delphi-Version nutzt du denn?
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
Hawkeye219

Registriert seit: 18. Feb 2006
Ort: Stolberg
2.227 Beiträge
 
Delphi 2010 Professional
 
#10

Re: IndexOf case sensitive / Performance verbessern

  Alt 7. Mär 2009, 15:36
Hallo,
Zitat von himitsu:
Welche Delphi-Version nutzt du denn?
D5 laut seinem Eröffnungsbeitrag - CompareStrings wurde mit Delphi 6 eingeführt.

Gruß Hawkeye
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:36 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz