Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Object-Pascal / Delphi-Language (https://www.delphipraxis.net/32-object-pascal-delphi-language/)
-   -   Delphi Texte nach Schlüsselworten durchsuchen und kategorisieren (https://www.delphipraxis.net/89405-texte-nach-schluesselworten-durchsuchen-und-kategorisieren.html)

gkoeder 30. Mär 2007 15:13


Texte nach Schlüsselworten durchsuchen und kategorisieren
 
Hallo zusammen,

für ein aktuelles Projekt muss ich eine Formel (String) nach verschiedenen Schlüsselworten durchsuchen. Je nach Schlüsselwort wird dann der String verschiedenen Kategorien zugeordnet.

Es gibt z.B. Schlüsselwortkategorien wie:

Kategorie: Functions
- Min
- Max
- Sum
- ...

Kategorie: Logical Functions
- AND
- OR
- NOT
- TRUE
- FALSE

Wenn nun eine Formel wie "A2=MIN(B1:B10)" analysiert wird, so soll diese Formel der Kategorie "Functions" zugeordnet werden. Es kann auch sein, dass eine Formel mehreren Kategorien angehört (Je nachdem, ob Elemente aus diesen Kategorien verwendet werden).

Zugegebenermaßen trete ich aktuell ein wenig auf der Stelle und weiss nicht so recht, wie ich das obige Problem abbilden kann. Da es sich um eine sehr große Zahl zu analysierender Formeln handelt, spielt auch die Geschwindigkeit der Analyse eine wichtige Rolle.

Hat vielleicht irendwer einen Tipp oder Idee, wie das zu lösen ist?

Danke und viele Grüße
Gerald

Der_Unwissende 31. Mär 2007 08:55

Re: Texte nach Schlüsselworten durchsuchen und kategorisiere
 
Zitat:

Zitat von gkoeder
Zugegebenermaßen trete ich aktuell ein wenig auf der Stelle und weiss nicht so recht, wie ich das obige Problem abbilden kann.

Hi,
auf welcher Stelle trittst Du gerade? Hast Du überhaupt keinen Ansatz? Ist Dir Dein Ansatz nicht schnell genug? ...

Für den Fall, dass Dir nur der generelle Ansatz fehlt, kannst Du immer mit dem einfachsten Fall beginnen. Der besteht sicherlich darin, dass Du für jedes Schlüsselwort prüfst, ob es in einem String vorkommt. Ist dies der Fall, so kennst Du die Kategorie.
Alles was Du dazu brauchst ist dann ein Datentyp, der die Kategorien speichert (z.B. ein Set) und eine Funktion, mit der Du die Position eines SubStrings in einem String ermittelst (z.B. die Delphi Funktion Pos).

Das wär's dann schon. Natürlich gibt es gleich eine einfache Verbesserung, die Du vornehmen kannst, so reicht Dir ein AND oder ein OR oder ein NOT (...) um zu wissen, dass es sich um eine Logische Operation handelt. Kommt mehr als ein solches Schlüsselwort im String vor, so wird dies nichts an dieser Kategorie ändern. Du brauchst also für jede Kategorie nur ein Schlüsselwort finden.
Das entspricht der logischen Oder-Verknüpfung der Überprüfung, ob eines der Schlüsselworte in der Formel ist:

Delphi-Quellcode:
if (Pos('AND', formel) > 0) or
   (Pos('OR', formel) > 0) or
   ....
Dabei wertet Delphi an dieser Stelle Terme nur bei Bedarf aus. Für die Oder-Verknüpfung reicht ein True aus um den Wahrheitswert des Terms zu bestimmen. Ist also die erste Abfrage schon wahr, werden die anderen nicht betrachtet (der Term ist eh wahr). Das gleiche gilt für False und die logische Und-Verknüpfung.
Hier solltest Du also die Abfragen so anordnen, dass die Schlüsselworte, die am häufigsten vorkommen möglichst als erstes geprüft werden.

Nun kannst Du einfach für jede Kategorie eine solche Abfrage durchführen und erhälst die Kategorien.

Weitere Verbesserungen sind sicherlich auch noch möglich (z.B. die Verwendung von FastString, was schnelleres Suchen in Strings ermöglicht).

Gruß Der Unwissende

Sharky 31. Mär 2007 09:22

Re: Texte nach Schlüsselworten durchsuchen und kategorisiere
 
Hai gkoeder,

ein Ansatz könnte auch sein den String als erstes in seine Bestandteile zu zerlegen und diese dann in einer Verkettetenliste zu speichern. Bei jedem Eintrag in der Liste speicherst Du dann den Text und die Information um welche Art es sich handelt.

Als "Arten" hast Du dann zum Beispiel Trennzeichen(Typ =1), Klammern(2), Zuweisungen(3), Zeilenumbrüche(4), Text(5).

Das könnte zum Beispiel in einem Record hinterlegt werden.
Code:
TToken = Record
          text : String;
          type : Integer;
         end;
Dein Beispiel String würde dann aus diesen "Tokens" bestehen:

Code:
   Record 1
     text A2
     type 5
   Record 2
     text =
     type 3
   Record 3
     text MIN
     type 5
   Record 4
     text (
     type 2
   Record 5
     text B1
     type 5
   Record 6
     text :
     type 1
   Record 7
     text B10
     type 5
   Record 8
     text )
     type 2
   Record 9
     text #10#13
     type 4
Jetzt kannst Du recht einfach überpüfen was in dem String steht.
Das ganze ist natürlich nur ein einfaches Beispiel. Um so genauer Du die Typen definierst um so besser kannst Du einen String untersuchen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 01:58 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz