Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Object-Pascal / Delphi-Language (https://www.delphipraxis.net/32-object-pascal-delphi-language/)
-   -   Delphi Query in csv:welche schnelle Funktion zum suchen/ersetzen? (https://www.delphipraxis.net/94624-query-csv-welche-schnelle-funktion-zum-suchen-ersetzen.html)

juergen 24. Jun 2007 12:21


Query in csv:welche schnelle Funktion zum suchen/ersetzen?
 
Hallo zusammen,
ich speichere das Ergebnis einer SQL-Abfrage direkt in eine csv-Datei ab.
Das funktioniert gut und schnell.
Nun muss ich (leider :( ) das Ergebnis der SQL-Abfrage jeweils VOR dem Abspeichern nach einem bestimmten Zeichen (verwendeter Seperator für die csv-Datei) durchsuchen und ersetzen.
Da die Datenmenge mehrere Millionen Datensätze betragen kann, hier meine Frage:
- welche schnelle (!) Suchen-und Ersetzen Funktion sollte ich verwenden?

Bzw. wenn es Geschwindigkeits-Vorteile bringt, würde auch ein generelles Entfernen (also ohne Ersetzen) reichen.

mkinzler 24. Jun 2007 12:27

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Wie speicherst du die CSV-Datei? Vielleicht kann man dort den Separator ändern.
-CSV-DataSet
-Ersetzen im Stream

juergen 24. Jun 2007 15:02

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Hallo mkinzler,
ich speichere in keinen Stream, sondern füge jedes Feld direkt in einer Datei an.
Hier 2 weitere Schleifen für Suchen und Ersetzen einzufügen, wird das ganze wohl ziemlich bremsen.
Im Moment sieht mein Source für das Erstellen der csv-Datei wie folgt aus:


Delphi-Quellcode:
var
  Var_DS: Integer;
  Var_my_File_String: TStringList;
  Var_Cell: string;

begin
  Pfadelesen; // eine zuvor ausgeführte procedure
  Iniauslesen; //eine zuvor ausgeführte procedure
  Query1.DatabaseName := my_nice_DB_Name;
  Query1.SQL.add(sql);
  Query1.Active := true;
  Query1.FindFirst;
  Var_my_File_String := TStringList.Create;

  try
    while not (query1.eof) do
    begin
      Var_Cell := '';
      for Var_DS := 0 to Pred(Query1.FieldCount) do
      begin
        Var_Cell := Var_Cell + query1.Fields[VAR_DS].AsString;
        if (Var_DS < Pred(Query1.FieldCount)) then
        begin
          Var_Cell := Var_Cell + (Seperator_from_ini); // der in einer ini-Datei "hinterlegte" Seperator wird hier eingefügt
        end;
      end;
      Var_my_File_String.Add(Var_Cell);
      Query1.Next;
      Application.ProcessMessages;
    end;
    Var_my_File_String.SaveToFile(Ausgabename)
  finally
    Var_my_File_String.Free;
  end;
  Query1.Close;
end;
Wäre natürlich für jede Optimierung dankbar!

mkinzler 24. Jun 2007 15:08

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Ich verstehe dein Problem nicht du setzt doch in deinem Code den Separartor. Warum setzt du dann nicht gleich den richtigen?

juergen 24. Jun 2007 15:52

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Das Problem ist, dass die Ergebnisse aus der/den Tabelle(n) auch Zeichen enthalten können, welche dem vorgegebenem Seperator entsprechen.
Somit wäre mein Dateiaufbau nicht richtig.
Ich muss also meine Variable "Var_Cell" noch nach dem vorgegebenem Seperatort durchsuchen und ggf. erstzen oder löschen.

marabu 24. Jun 2007 15:57

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Hallo Jürgen,

eine korrekte CSV-Datei könntest du auch so erzeugen:

Delphi-Quellcode:
procedure ValuesToStrings(fields: TFields; s: TStrings);
var
  i: Integer;
begin
  s.Clear;
  for i := 0 to Pred(fields.Count) do
    s.Add(fields[i].AsString);
end;

procedure SaveAsCSV(const select, fn: string; delimiter, quoteChar: Char);
var
  s: TStrings;
  fs: TStream;
  line: string;
begin
  s := TStringList.Create;
  s.Delimiter := delimiter;
  s.QuoteChar := quoteChar;

  fs := TFileStream.Create(fn, fmCreate);

  with TQuery.Create(nil) do
  try
    DatabaseName := 'my_nice_DB_Name';
    SQL.Text := select;
    Open;
    // WriteNames ?
    while not Eof do
    begin
      ValuesToStrings(Fields, s);
      line := s.CommaText + sLineBreak;
      fs.Write(line[1], Length(line));
      Next;
      Application.ProcessMessages;
    end;
    Close;
  finally
    Free;
    fs.Free;
    s.Free;
  end;
end;
Dabei werden die üblichen Besonderheiten bereits berücksichtigt. Der Code muss sicher noch etwas poliert werden und ist nicht getestet, sollte aber zeigen worauf es ankommt.

Freundliche Grüße

mkinzler 24. Jun 2007 16:00

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Dann für doch die Ersetzung gleich vor dem Zusammensetzen aus. Oder Quote die Strings.

Delphi-Quellcode:
Var_Cell := Var_Cell + StringReplace(query1.Fields[VAR_DS].AsString, Seperator_from_ini, '', [rfReplaceAll]);

marabu 24. Jun 2007 16:23

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Hallo Markus,

ich habe es zwar nicht besonders hervorgehoben, aber ein Pferdefuß an Jürgens Ansatz ist die vollständige Zwischenspeicherung der CSV-Daten im Hauptspeicher. Bei mehreren Millionen Datensätzen könnte es notwendig werden den Hauptspeicher aufzustocken. Ich schreibe deshalb jede Zeile sofort auf die Platte. Bei Laufzeitproblemen lässt sich eine Pufferung mit wenigen Zeilen Quellcode ergänzen.

CommaText erzeugt übrigens korrekte CSV-Zeilen, auch wenn das Trennzeichen in den Daten selbst vorkommt.

Freundliche Grüße

mkinzler 24. Jun 2007 16:27

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Hallo Achim,
Ich wollte ihn ja nur darauf hinweisen, das das "Zusammenbauen" der Zeilen und das Ersetzen in einem Arbeitsgang erfolgen kann, ob man das Ergebnis puffert oder sofort speichert.

juergen 24. Jun 2007 21:06

Re: Query in csv:welche schnelle Funktion zum suchen/ersetze
 
Hallo,
ok, die schnellste Variante ist die Lösung von mkinzler im selben Schritt der Dateizusammenstellung das Replace auszuführen.

Der Einwurf von marabu ist aber auch wichtig. Das mit dem Arbeitsspeicher war mir nicht so bewusst.
Morgen werde ich auf Arbeit einen Test mit entsprechenden Datenmengen vollziehen können.
Dann weiß ich in etwa, wie sich der Speicher zubaggert, wie groß die csv-Datei in etwa werden kann und wie sich das Laufzeitverhalten darstellt.
Ich werde dann wohl einen weiteren Parameter in meine ini-Datei aufnehmen -> huge_amount_of_Data...
Dann kann ich zusätzlich die Variante von marabu versuchen umzusetzen.

Vielen Dank euch beiden und einen schönen Sonntag noch! :thumb:


Alle Zeitangaben in WEZ +1. Es ist jetzt 10:40 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz