Delphi-PRAXiS
Seite 2 von 3     12 3      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Datenbanken (https://www.delphipraxis.net/15-datenbanken/)
-   -   Delphi fuzzy matches via sql (https://www.delphipraxis.net/68502-fuzzy-matches-via-sql.html)

mkinzler 4. Mai 2006 09:18

Re: fuzzy matches via sql
 
Beispiel einer einfachen Levenstein-Funktion:

Delphi-Quellcode:
function LevenshteinDistance( s: string; t: string): Integer;
var
  i, j, cost, h: Integer;
  d: array[0..255, 0..255] of integer;
  n,m: integer;
begin
   n := Length(s);
   m := Length(t);

   for i := 0 to n do
       d[i,0] := i;
   for j := 0 to m do
       d[0,j] := j;
   for i := 1 to n do
       for j := 1 to m do
       begin
           if s[i] = t[j] then cost := 0
                          else cost := 1;
           h := min(d[i-1,j ] + 1,   // Einfügen
                             d[i, j-1] + 1); // Löschen
           d[i,j] := min(    h,
                             d[i-1,j-1] + cost); // Ersetzen
        end;
   result := d[n,m];
end;
Wenn du diese Funktion in eine UDF verpackst, kannst du diese in einer SP verwenden.

Kedariodakon 4. Mai 2006 10:56

Re: fuzzy matches via sql
 
SQL-Code:
Select Top 1 Abs( feld - x ) As Sort, * From tabelle
Order By Sort
Bye

Edit funzt zumindest solange x eine Zahl ist :wink:

sancho1980 4. Mai 2006 11:16

Re: fuzzy matches via sql
 
Zitat:

Beispiel einer einfachen Levenstein-Funktion:
Cool, danke
Am elegantesten wärs natürlich wenn ich das Ganze jetz als stored procedure implementiere
geht das?
keine angst, versuch das dann selbst irgendwie zu bauen; nur mal so ne frage ob's möglich ist, (feld-)variablen in einer sp zu deklarieren...


Zitat:

zumindest solange x eine Zahl ist
was ja mal eben nicht der Fall ist :mrgreen:

mkinzler 4. Mai 2006 11:23

Re: fuzzy matches via sql
 
Liste der Anhänge anzeigen (Anzahl: 1)
Ich habe hier mal zum Test, die UDF und eine SP erzeugt. Ich hoffe es hilft dir.

sancho1980 4. Mai 2006 11:54

Re: fuzzy matches via sql
 
cool danke,
voll nett
versuch das abend gleich mal zu installieren
evtl muss ich nochmal nerven :stupid:

mkinzler 4. Mai 2006 13:31

Re: fuzzy matches via sql
 
Ich habe die UDF um einen Parameter erweitert und die SP angepasst.

Die UDF hat unterschiedliche Längen der beiden Strings berücksichtigt. Das in diesem Fall zu falschen Ergebnissen führen kann.

z.B.

Daten Tabelle:

ID TEXT
...
10 Gemüse
11 Z

Suchtext: gem

Es wird der Datensatz 11 zurückgeliefert da zur Umformung hier weniger Schritte notig sind als beim Datensatz 10.

Es gibt nun einen weiteren Parameter in dem den Umgang der Längen steuern kann
0: Wie bisher
1: Länge erster String ( 2. String wird ggf mit Leerzeichen aufgefüllt)
2: Länge zweiter String ( 1. String wird ggf mit Leerzeichen aufgefüllt)
3: es wird die Länge des kürzesten Strings verwendet.

Ich habe das Originalarchiv ersetzt.

Kedariodakon 4. Mai 2006 14:32

Re: fuzzy matches via sql
 
Naja, das ist halt Levenshtein :wink:
Für das Problem kann man verschiedene Kosten implementieren, wass schlußendlich noch Levenshtein ist im gegensatz zu dem was du da mit dem Auffüllen machst :roll:

Levenshtein

Zudem is deine Levenshtein Funktion ein wenig naja, wenn die Zeichenketten mit mehr als 255 Zeichen bekommt, knallts...

Besser wer sicher ein dynamisches Array... :)

Bye Keda

mkinzler 4. Mai 2006 14:39

Re: fuzzy matches via sql
 
Das ganze war auch nicht als Universal-Lösung gedacht, sondern als Beispiel wie man das lösen könnte.

mkinzler 4. Mai 2006 15:47

Re: fuzzy matches via sql
 
In Anlehnung an die Bemerkung von [user="Kedariodakon"] habe ich meine unvollständige, fehlerhaftes Test-UDF/SP nochmal überarbeitet. Auch dieses ist gewiss unvollständig und zerstörrt möglicherweise euren Rechner und ... ;-)

Die Kosten sind nun als 4. Parameter implementiert.

Ich habe wieder das Original ersetzt.

sancho1980 5. Mai 2006 00:15

Re: fuzzy matches via sql
 
Hi Leute,
hab mir die Geschichte mit dem Levenshtein mal zu Gemüte geführt. Dazu 2 Fragen:

1.
Zitat:

Die Kosten sind nun als 4. Parameter implementiert.
Wieso? Die Kosten sind doch der Rückgabewert.. Was gibt's da zu übergeben?

2.
Hab mir auch mal durchgelesen wie der Algorithmus funktioniert. Interessant, dass es funktioniert; aber kapiert einer von euch wie man auf sowas kommt? Gibt's irgendwo nen Beweis, dass der Algorithmus immer das richtige Ergebnis liefert?

Gruß,

Martin


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:16 Uhr.
Seite 2 von 3     12 3      

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz