Delphi-PRAXiS
Seite 2 von 3     12 3      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Boyer-Moore für Unicode (https://www.delphipraxis.net/161028-boyer-moore-fuer-unicode.html)

mkinzler 14. Jun 2011 09:26

AW: Boyer-Moore für Unicode
 
Ein Versuch wäre bei dir ja, wie man sieht, eh sinnlos.

Schorschi5566 14. Jun 2011 10:01

AW: Boyer-Moore für Unicode
 
Bin guten Argumenten gegenüber immer aufgeschlossen.

Aber vorhandenen, funktionierenden Code der schönen Struktur wegen zu verlangsamen oder unnötig auszuweiten, widerstrebt mir. ;)

jbg 14. Jun 2011 12:10

AW: Boyer-Moore für Unicode
 
Hast du die Warnungen des Compiler deaktiviert? Denn "i" ist nach der Schleife undefiniert. Und nur weil der aktuelle Compiler hier die Schleife nicht optimiert, funktioniert das. Zukünfige Compiler könnten da aber schon mal Hand ansetzen. Eine C-for-Schleife muss nicht immer unbedingt in eine Pascal-for-Schleife umgewandelt werden.

Hast du auch die $STRINGCHECKS deaktiviert? Denn die fressen die Performance auf. Da ist dein "ein JMP gespart" belanglos, was es ohnehin dank Jump-Optimierung seitens Delphi bereits ist. Delphi erkennt, dass du mit "break" auf ein "goto" springst, und leitet den Sprung direkt weiter ohne den Zwischenstopp. (Einfach mal den Assemblercode im CPU-View anschauen).

Zudem könnte man die Subtraktion aus der inneren Schleife nehmen, indem man auf zwei PChar umstellt und beide mit Dec() rückwärts laufen lässt ("- k"). Und wenn man schon dabei ist, kann man auch gleich noch die if-Abfrage in der inneren Schleife entfernen und dafür die for-Schleifen-Grenze anpassen.
Außerdem kann man sich den j=0 Durchlauf sparen, da dort für all i (und k) überhaupt nichts geschieht, außer ein vollständiger unnötiger i-Durchlauf.

jbg 14. Jun 2011 12:13

AW: Boyer-Moore für Unicode
 
Du kannst auch noch einen Speicherzugriff einsparen, wenn du das FBadTable dynamische Array direkt als "array[0..65535] of Integer" deklarierst. Da entfällt eine Speicher-Indirektion und du brauchst keinen eigenen Konstruktor mehr.

Deep-Sea 14. Jun 2011 12:15

AW: Boyer-Moore für Unicode
 
Zitat:

Zitat von Schorschi5566 (Beitrag 1106216)
Delphi-Quellcode:
[...]
            if (Pattern[iPLen - k + 1] <> Pattern[i - k + 1]) then
              Goto NextTryFwd;
          end;
          Goto MatchedFwd;
NextTryFwd:
        end;
MatchedFwd:
        FGoodTable[j] := iPLen - i;
      end;
    end
[...]

Kommt mir bekannt vor:
Code:
[...]
                if (p[plen - k] != p[i - k]) {
                    goto nexttry;
                }
            }
            goto matched;
nexttry:
            ;
        }
matched:
        next[j] = plen - i;
    }
[...]
Quelle: Wikipedia

Schorschi5566 14. Jun 2011 19:54

AW: Boyer-Moore für Unicode
 
@Deep-Sea:
Zitat:

Zitat von Schorschi5566 (Beitrag 1106233)
Aber ich will mich nicht mit fremden Federn schmücken. Der Teil ist aus den einschlägigen Beispielen für Boyer-Moore entnommen und von mir lediglich an Delphi und die Rückwärtssuche angepaßt worden.

@jbg:
Zitat:

Da ist dein "ein JMP gespart" belanglos, was es ohnehin dank Jump-Optimierung seitens Delphi bereits ist. Delphi erkennt, dass du mit "break" auf ein "goto" springst, und leitet den Sprung direkt weiter ohne den Zwischenstopp. (Einfach mal den Assemblercode im CPU-View anschauen).
Danke, das war mir neu. :)

@all:
Ich hab mal den "goto-verseuchten" Teil umgeschrieben. ;)

Delphi-Quellcode:
      // Good-Suffix-Table vorwärts
      FGoodTable[0] := 1;
      j := 1;
      i := iPLen - 1;
      k := 0;
      bMatch := False;
      while j < iPLen do
      begin
        while (i > 0) and (k <> j) do
        begin
          while (k < j) and (i - k > 0) and (Pattern[iPLen - k] = Pattern[i - k]) do
          begin
            bMatch := True;
            inc(k);
          end;
          if (k < j) then // kein ganzes Suffix gefunden
          begin
            if i-k <= 0 then
              i := 0 // Maximal-Skip
            else
            begin
              if bMatch then // kein Match mit dieser Länge...weitersuchen
              begin
                k := 0; // wieder von vorn
                bMatch := False;
              end;
              Dec(i);
            end;
          end;
        end;
        FGoodTable[j] := iPLen - i;
        inc(j);
      end;

himitsu 14. Jun 2011 20:10

AW: Boyer-Moore für Unicode
 
Delphi-Quellcode:
goto NextStep;
=> Delphi-Referenz durchsuchenContinue (das Gegenstück zum Delphi-Referenz durchsuchenBreak)

Ansonsten ist diese Schleife, mit dem exit am ende vollkommen vermurkst, wenn das Exit immer die Schleife beendet, ist das schonmal ein guter Hinweis, daß da was nicht stimmt.
Aber wurde ja nun schon umgeschrieben.

PS: Mit goto kann man auch rückwärts springen, was dann das Exit-while-Goto durch ein goto ersetzt hätte. :roll:

Schorschi5566 14. Jun 2011 22:33

AW: Boyer-Moore für Unicode
 
Hallo Himitsu,

da hast du aber übersehen, dass Goto Nextstep an das Ende der äußeren Schleife springt, oder? :)

Deep-Sea 15. Jun 2011 08:16

AW: Boyer-Moore für Unicode
 
Zitat:

Zitat von himitsu (Beitrag 1106393)
[...] wenn das Exit immer die Schleife beendet, ist das schonmal ein guter Hinweis, daß da was nicht stimmt.

Naja, bei einer Suche ist das aber fast die Regel :stupid:
Beispiel:
Delphi-Quellcode:
function FindeEtwas(const AName: String): String;
var
  I: Integer;
begin
  For I := 0 to EineListe.Count - 1 do
  begin
    If EineListe[I].Name = AName then Exit(EineListe[I].Wert);
  end;
  Result := '< Nicht gefunden >';
end;
Wenn ich nicht mit Exit gehen dürfte, müsste ich das "Nicht gefunden" ggf. sinnlos am Anfang zuweisen und dann bei Erfolg einen Block aufmachen und einmal Result zuweisen und Break aufrufen. Imho komplizierter - zumindest seit es das verbesserte Exit gibt *es liebe* :P

himitsu 15. Jun 2011 08:53

AW: Boyer-Moore für Unicode
 
Das IF liegt aber nicht direkt in der Schleife, sondern in dem IF. :wink:

Delphi-Quellcode:
For I := 0 to EineListe.Count - 1 do
begin
  ...
  Exit(...);
end;
Und was sagst du dazu?

PS: Sowas ist oben in den beiden drei verschachtelten Schleifen auch drin, die Mittlere wird niemals durchlaufen, da sie anscheinend (falls ich das richtig seh) immer gleich im ersten Durchgang abgebrochen wird.


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:03 Uhr.
Seite 2 von 3     12 3      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz