AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Strings auf Ähnlichkeit überprüfen

Ein Thema von Gambit · begonnen am 12. Mär 2005 · letzter Beitrag vom 13. Mär 2005
Antwort Antwort
Gambit

Registriert seit: 28. Mai 2003
680 Beiträge
 
Delphi 7 Professional
 
#1

Strings auf Ähnlichkeit überprüfen

  Alt 12. Mär 2005, 21:28
Hallo,
ich möchte zwei Strings auf Ähnlichkeit überprüfen.
Dabei soll ausgegeben werden zu wieviel Prozent sich die Strings ähneln.
Dazu splitte ich die Strings zunächst in die enthaltenen Wörter und schreibe sie in jeweils eine ListBox. Danach prüfe ich nach, zu wieviel Prozenz die Wörter aus dem ersten String im zweiten enthalten sind und nutze dazu auch die SoundexSimillar Funktion um Rechtschreibfehler soweit möglich auszuschließen. Am Schluss prüfe ich noch zu wieviel Prozent die Wörter aus dem ersten String im zweiten enthalten sind:

Delphi-Quellcode:
procedure TForm1.Button1Click(Sender: TObject);
var i, j, SimillarWordsCounter: Integer;
begin
  ListBox1.Items:= filter(PChar(Edit1.Text));
  ListBox2.Items:= filter(PChar(Edit2.Text));

  for i:= 0 to ListBox1.Items.Count-1 do
  begin
    for j:= 0 to ListBox2.Items.Count-1 do
    begin
      if SoundExSimilar(ListBox1.Items.Strings[i], ListBox2.Items.Strings[j], 4) then
      SimillarWordsCounter:= SimillarWordsCounter+1;
    end;
  end;
  showMessage('Strings ähneln sich zu '+
              IntToStr(((SimillarWordsCounter div ListBox1.Items.Count * 100)
              +(ListBox1.Items.Count+ListBox2.Items.Count)div 2*100)div 2)+ ' %') ;
end;

function filter(source:PChar):TStringList;
var p, start : PChar;
    token : string;
begin
  result := TStringList.Create;
  p := source;
  while (p^ <> #0) do begin
     if p^ in [#1..#64,#91..#96,#123..#127] then Inc(p)
     else begin // ein Wort wurde gefunden ...
       start := p;
       while not (p^ in [#0..#64,#91..#96,#123..#127]) do Inc(p);
       SetString(token, start, p-start);
       result.Add(token)
     end
  end
end;
Vielleicht hat ja jemand 'ne Anregung, in wie weit man die Prüfung noch verbessern könnte. Außerdem bin ich mir nicht sicher, ob die statistische Auswertung in showMessage so OK ist.

Gruß

Gambit
  Mit Zitat antworten Zitat
Benutzerbild von Binärbaum
Binärbaum

Registriert seit: 19. Jan 2005
Ort: Elstra
764 Beiträge
 
Delphi 7 Enterprise
 
#2

Re: Strings auf Ähnlichkeit überprüfen

  Alt 13. Mär 2005, 01:43
Zitat von Gambit:
ich möchte zwei Strings auf Ähnlichkeit überprüfen.
Schau dir dazu doch mal die Levenshtein-Distanz an. Das wäre ein möglicher Ansatz, um zwei Strigs auf Ähnlichkeit zu überprüfen.

MfG
Binärbaum
There are exactly 10 kinds of people: those who understand binary, and those who don't.
---
"Software reift beim Kunden. Bei Hardware ist es anders: Hardware fault beim Kunden." - Rainer G. Spallek
  Mit Zitat antworten Zitat
schuetze09

Registriert seit: 3. Mär 2004
113 Beiträge
 
Delphi 2005 Architect
 
#3

Re: Strings auf Ähnlichkeit überprüfen

  Alt 13. Mär 2005, 08:46
@Gambit:
Hallo, vielleicht hilft dir das Fuzzy-Search-Unit
(Textsuche mit unscharfer Logik. Sie findet nicht nur übereinstimmende, sondern auch ähnliche Textstellen)

MfG
schuetze09
  Mit Zitat antworten Zitat
Benutzerbild von mirage228
mirage228

Registriert seit: 23. Mär 2003
Ort: Münster
3.750 Beiträge
 
Delphi 2010 Professional
 
#4

Re: Strings auf Ähnlichkeit überprüfen

  Alt 13. Mär 2005, 08:57
Hi,

Delphi hat die Funktion Delphi-Referenz durchsuchenSoundEx in der Unit "StrUtils", die imho auch mit dem Levenshtein Verfahren arbeitet.

mfG
mirage228
David F.

May the source be with you, stranger.
PHP Inspection Unit (Delphi-Unit zum Analysieren von PHP Code)
  Mit Zitat antworten Zitat
Gambit

Registriert seit: 28. Mai 2003
680 Beiträge
 
Delphi 7 Professional
 
#5

Re: Strings auf Ähnlichkeit überprüfen

  Alt 13. Mär 2005, 09:04
ich arbeite doch schon mit SoundEx(siehe oben...)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:38 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz