AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein (unscharfer) Vergleich zweier Listen
Thema durchsuchen
Ansicht
Themen-Optionen

(unscharfer) Vergleich zweier Listen

Ein Thema von DocBorn · begonnen am 4. Sep 2006 · letzter Beitrag vom 4. Sep 2006
Antwort Antwort
DocBorn

Registriert seit: 7. Jul 2006
Ort: Bonn
26 Beiträge
 
#1

(unscharfer) Vergleich zweier Listen

  Alt 4. Sep 2006, 17:03
Hallo Leute,

ich habe im Moment ein algorithmisches Problem. Ich habe zwei Listen mit Album-Titeln und möchte herausfinden welche Titel in der zweiten Liste vorkommen, nicht aber in der ersten.

Zu allererst hab ich natürlich alle gleichen rausgeworfen und dann halt noch so kleine Tricks wie vorher "ersetze alle nicht-Buchstaben durch Leerzeichen, entferne doppelte Leerzeichen". Allerdings will das alles nicht so richtig gut werden.

Dann habe ich zum Vergleich die Levenshtein-Distanz genommen. Sie nimmt zwei String entgegen und gibt eine Integer zurück wie viele Bearbeitungsschritte nötig sind um den einen String in den andern zu überführen, dabei ist "Zeichen hinzufügen", "Zeichen entfernen" und "Zeichen durch ein anderes ersetzen" je ein Arbeitsschritt.

Wenn diese Distanz dann (Wortlänge div 10) unterschreitet behandle ich die Titel als gleich. Der Vorteil ist halt, dass ich dadurch mit Tippfehlern und sowas wie "(maxi)" am Ende des Album-Titels klar komme. Leider ist diese Vorgehensweise relativ inperformant, also so Ausführungszeiten von ner halben Minute oder so sind ja unangenehem.

Ich wollte jetzt einfach hier mal fragen ob jemand konstruktive Vorschläge hat, oder ob der ein oder andere sowas schonmal gemacht hat und evtl. Erfahrungen weitergeben kann.

Danke im Vorraus.

Lars
  Mit Zitat antworten Zitat
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#2

Re: (unscharfer) Vergleich zweier Listen

  Alt 4. Sep 2006, 17:56
Dann scheint deine Levenshtein - Implementierung etwas unperformant zu sein.
Zeig mal den Code.
Meine Levenshtein-DLL braucht für 1 Mio Vergleiche ca 2.13 Sekunden.
Delphi-Quellcode:
var
   i, p : Integer;
   x : IStopWatch;
begin
   x := CreateStopWatch;
   x.Start;
   for i := 1 to 1000000 do
      p := LevenshteinDistance('delphipraxis', 'delphinpraxnix');

   ShowMessageFmt('%f', [x.Seconds]);
end;
Andreas
  Mit Zitat antworten Zitat
alzaimar
(Moderator)

Registriert seit: 6. Mai 2005
Ort: Berlin
4.956 Beiträge
 
Delphi 2007 Enterprise
 
#3

Re: (unscharfer) Vergleich zweier Listen

  Alt 4. Sep 2006, 18:53
Ich kenn den genauen Algorithmus nicht, aber versuchs doch mal mit zwei anderen Strings. Ich meine, wenn die eh fast identisch sind, was soll der Algorithmus denn noch ausrechnen?
"Wenn ist das Nunstruck git und Slotermeyer? Ja! Beiherhund das Oder die Flipperwaldt gersput!"
(Monty Python "Joke Warefare")
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 15:33 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz