Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   (unscharfer) Vergleich zweier Listen (https://www.delphipraxis.net/76441-unscharfer-vergleich-zweier-listen.html)

DocBorn 4. Sep 2006 17:03


(unscharfer) Vergleich zweier Listen
 
Hallo Leute,

ich habe im Moment ein algorithmisches Problem. Ich habe zwei Listen mit Album-Titeln und möchte herausfinden welche Titel in der zweiten Liste vorkommen, nicht aber in der ersten.

Zu allererst hab ich natürlich alle gleichen rausgeworfen und dann halt noch so kleine Tricks wie vorher "ersetze alle nicht-Buchstaben durch Leerzeichen, entferne doppelte Leerzeichen". Allerdings will das alles nicht so richtig gut werden.

Dann habe ich zum Vergleich die Levenshtein-Distanz genommen. Sie nimmt zwei String entgegen und gibt eine Integer zurück wie viele Bearbeitungsschritte nötig sind um den einen String in den andern zu überführen, dabei ist "Zeichen hinzufügen", "Zeichen entfernen" und "Zeichen durch ein anderes ersetzen" je ein Arbeitsschritt.

Wenn diese Distanz dann (Wortlänge div 10) unterschreitet behandle ich die Titel als gleich. Der Vorteil ist halt, dass ich dadurch mit Tippfehlern und sowas wie "(maxi)" am Ende des Album-Titels klar komme. Leider ist diese Vorgehensweise relativ inperformant, also so Ausführungszeiten von ner halben Minute oder so sind ja unangenehem.

Ich wollte jetzt einfach hier mal fragen ob jemand konstruktive Vorschläge hat, oder ob der ein oder andere sowas schonmal gemacht hat und evtl. Erfahrungen weitergeben kann.

Danke im Vorraus.

Lars

shmia 4. Sep 2006 17:56

Re: (unscharfer) Vergleich zweier Listen
 
Dann scheint deine Levenshtein - Implementierung etwas unperformant zu sein.
Zeig mal den Code.
Meine Levenshtein-DLL braucht für 1 Mio Vergleiche ca 2.13 Sekunden.
Delphi-Quellcode:
var
   i, p : Integer;
   x : IStopWatch;
begin
   x := CreateStopWatch;
   x.Start;
   for i := 1 to 1000000 do
      p := LevenshteinDistance('delphipraxis', 'delphinpraxnix');

   ShowMessageFmt('%f', [x.Seconds]);
end;

alzaimar 4. Sep 2006 18:53

Re: (unscharfer) Vergleich zweier Listen
 
Ich kenn den genauen Algorithmus nicht, aber versuchs doch mal mit zwei anderen Strings. Ich meine, wenn die eh fast identisch sind, was soll der Algorithmus denn noch ausrechnen?


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:56 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz