Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   String in Datei finden, jedoch nicht bei 0 starten (https://www.delphipraxis.net/178324-string-datei-finden-jedoch-nicht-bei-0-starten.html)

MechMac666 1. Jan 2014 21:12

String in Datei finden, jedoch nicht bei 0 starten
 
Hallo,

nach längerer Suche habe ich eine Funktion gefunden, mit der ich eine Datei nach einem String durchsuchen kann:

Delphi-Quellcode:
 function ScanFile(const filename: string; const forString: string; caseSensitive: Boolean ): LongInt;
const BufferSize= $8001;
var
  pBuf, pEnd, pScan, pPos: Pchar;
  filesize: LongInt;
  bytesRemaining: LongInt;
  bytesToRead: Integer;
  F: File;
  SearchFor: Pchar;
  oldMode: Word;
begin
  result := -1;
  if (Length(forString) = 0) or (Length(filename) = 0) then Exit;
  SearchFor := nil;
  pBuf := nil;
  AssignFile(F, filename);
  oldMode := FileMode;
  FileMode := 0;
  Reset(F, 1);
  FileMode := oldMode;
  try
    SearchFor := StrAlloc(Length(forString) + 1);
    StrPCopy(SearchFor, forString);
    if not caseSensitive then AnsiUpper(SearchFor);
    GetMem(pBuf, BufferSize);
    filesize := System.Filesize(F);
    bytesRemaining := filesize;
    pPos := nil;
    while bytesRemaining > 0 do
    begin
      if bytesRemaining >= BufferSize then bytesToRead := Pred(BufferSize)
                                      else bytesToRead := bytesRemaining;
      BlockRead(F, pBuf^, bytesToRead, bytesToRead);
      pEnd := @pBuf[bytesToRead];
      pEnd^:= #0;
      pScan := pBuf;
      while pScan < pEnd do
        begin
          if not caseSensitive then AnsiUpper(pScan);
          pPos := StrPos(pScan, SearchFor);
          if pPos <> nil then
            begin
              result := FileSize - bytesRemaining + LongInt(pPos) - LongInt(pBuf);
              break;
            end;
          pScan := StrEnd(pScan);
          Inc(pScan);
        end;
      if pPos <> nil then break;
      bytesRemaining := bytesRemaining - bytesToRead;
      if bytesRemaining > 0 then
        begin
        seek(F, FilePos(F) - Length(forString));
        bytesRemaining := bytesRemaining + Length(forString);
        end;
    end;
  finally
    CloseFile(F);
    if SearchFor <> nil then StrDispose(SearchFor);
    if pBuf <> nil then FreeMem(pBuf, BufferSize);
  end;
end;



Leider habe ich es nicht geschafft, den Code so zu modifizieren, das ich eine Startposition angeben kann.
Der String, den ich suche, kommt öfters vor, so das ich gerne ab einer bestimmten Position suchen möchte statt immer bei 0.
Vermutlich haben pPos und pBuf etwas mit dem "Index" zu tun, aber Versuche wie
pPos:=PChar(85); <-85 sei hier eine Startposition
schlugen fehl.
Wer kann mir da weiterhelfen?


Gruß, Andreas

sx2008 1. Jan 2014 22:20

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Wie groß ist denn die maximale Dateilänge?
Man könnte die betreffende Datei ab der gewünschten Position komplett in der Speicher laden und dann suchen.
Die Restlänge sollte dann aber nicht zu groß sein.
Eleganter aber auch deutlich komplizierter ist es natürlich die Datei blockweise (8kB/Block) zu laden so wie es dein Codebeispiel macht.
Allerdings ist es relativ schwierig einen String zu finden der genau zwischen zwei Blöcken sitzt.


Wenn du mehrere Treffer finden möchtest wäre es ausserdem sinnvoll die Funktion mit einer Callback-Methode auszustatten.
Bei jedem Treffer wird dann die Callback-Methode aufgerufen und die gefundene Position übergeben.

MechMac666 1. Jan 2014 22:38

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Größer als 10 Mb sind die Dateien nicht. Und ich suche nur am Anfang der Datei. Etwa 50-100Kb.
Ich habe eine Funktion vorliegen, welche es erlaubt eine bestimmte Länge ab einer Startposition einzulesen, und als String auszugeben.
Nützt mir nur nicht viel, da ich ja aktuell nur das erste Vorkommen finden kann.

Aber da bringst du mich auf eine Idee. Ich Versuche nun etwas zu finden was nach dem zu durchsuchenden Bereich vorkommt. Ein Schlüsselwort oder so.
Dann lese ich den gesamten vorderen Bereich ein und kann es so einfacher händeln wenn es erstmal in einem String ist.


Gruß, Andreas

Furtbichler 1. Jan 2014 23:06

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Dann lese doch einfach die Datei in einen String und verwende PosEx. So etwa:

Delphi-Quellcode:
function FileToString(aFileName : String) : String;
Var
  m : TMemoryStream;
  s : TStringStream;

Begin
  m := TMemoryStream.Create;
  Try
    m.LoadFromFile (aFilename);
    s := TStringStream.Create('');
    Try
      s.CopyFrom(m,0);
      result := s.DataString;
    finally
      s.free
    end
  finally
    m.free
  end
end;

function FilePosEx(aFileName : String; aSearchString : String; aStartPos : Integer = 1) : Integer;
Var
 
  contents : String;

Begin
  contents := FileToString (aFilename);
  result := PosEx(aSearchString, contents, aStartPos);
End;
Getippt und ungetestet.

jaenicke 2. Jan 2014 09:26

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Theoretisch kann man bei der ersten Funktion einfach ein FileSeek benutzen um weiter hinten anzufangen. Die Funktion ist aber nicht sonderlich optimiert, besser wäre es bei großen Dateien mit MMFs zu arbeiten und bei kleineren Dateien kann man sich das alles sparen und Furtbichlers Methode benutzen.
Wobei ich mich da frage wofür der zweite TMemoryStream dienen soll, denn TStringStream ist schließlich selbst von TMemoryStream abgeleitet. Das Kopieren kann man sich sparen...

himitsu 2. Jan 2014 10:53

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Wozu kopierst du eigentlich in SearchFor, anstatt eine "normale" Stringvariable zu nutzen?

Nja, es gibt hier noch ein anderes Problem:
Was passiert wohl, wenn sich dein Such-String an der Grenze des Puffers befindet?


Also schon vor deinem Seek befindet, aber OK, das kann man ignorieren,
aber was ist, wenn er erst am Ende eines Buffers befindet?

Du liest ein Stück der Datei beim nächsten Durchlauf der Schleife, ist der Rest am Anfang des neuen Teils.
Da findet dein StrPos dann nichts.

Bei einem StringStream oder beim Einlesen in einen String kannst du auch Pos und gar Hier im Forum suchenContainsText verwenden.

Aber du mußt beim Einlesen das Ende (mindestens soviele Zeichen -1, wie im Suchstring beibehalten.


- Lese Zeichen Buffer
- suche
- kopiere die letzen Zeichen nach vorne und lese dahinter neue Zeichen ein (Buffergröße minus Suchgröße ab Position Suchgröße)
- suche
- kopiere die letzen Zeichen nach vorne und lese dahinter neue Zeichen ein (Buffergröße minus Suchgröße ab Position Suchgröße)
- suche
...



PS: Ab Delphi 2009 wird dein Code nicht mehr funktionieren, denn Dateioperation oder Datenübertragungen macht man NIEMALS mit dynamischen Typen (String, Char, NativeInt usw.), denn Diese verändern sich schnell mal!

p80286 2. Jan 2014 12:02

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Das ist aber echt ein altes Schätzchen.
a) benutze statt File,Assign und Blockread TFilestream. Das ist von der Syntax her ähnlich und zukunftssicherer.
b) falls Du eine Suchroutine brauchst die mehr kann als "echte" Strings suchen, dann solltest Du mit Bytearrays arbeiten.
c) bei "Pointerarithmetik" wie
Delphi-Quellcode:
inc(pScan,1);
habe ich immer ein schlechtes Gefühl.

Ansonsten solltest Du Dir das bereits geschriebene zu Herzen nehmen.

Gruß
K-H

Furtbichler 2. Jan 2014 13:47

AW: String in Datei finden, jedoch nicht bei 0 starten
 
Zitat:

Zitat von jaenicke (Beitrag 1241721)
Wobei ich mich da frage wofür der zweite TMemoryStream dienen soll, denn TStringStream ist schließlich selbst von TMemoryStream abgeleitet. Das Kopieren kann man sich sparen...

Ich hatte beim TStringStream auf die Schnelle keine 'LoadFromFile'-Methode gefunden.


Alle Zeitangaben in WEZ +1. Es ist jetzt 14:24 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz