Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Algorithmen, Datenstrukturen und Klassendesign (https://www.delphipraxis.net/78-algorithmen-datenstrukturen-und-klassendesign/)
-   -   "Dreckige" Zeichenkette bereinigen und kompilierbar machen (https://www.delphipraxis.net/211370-dreckige-zeichenkette-bereinigen-und-kompilierbar-machen.html)

DieDolly 5. Sep 2022 19:29

"Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Das ist leider zuviel für mich! Ich frage viel, werkle viel rum und finde dann mit eurer Hilfe immer irgendeine Lösung, auch wenn meine eigenen oft Frickeleien sind.
Aber das Problem bekomme ich nicht gelöst.

Wie mache ich aus
Code:
p'i
ein
Code:
p''i
(klar, mit StringReplace) aber ohne dabei sowas wie
Code:
X := '123' + '456' + sLineBreak + 'test' + sLineBreak + '.';
oder das erste und letzte
Code:
'
im String zu verändern?

Andreas13 5. Sep 2022 19:57

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Hast Du es mal mit
Delphi-Quellcode:
System.AnsiStrings.AnsiQuotedStr
probiert?

Delphi-Quellcode:
function AnsiQuotedStr(const S: AnsiString; Quote: AnsiChar): AnsiString;
"Wandelt einen String in einen in Anführungszeichen gesetzten String um.

AnsiQuotedStr gibt den gegebenen AnsiString als einen in Anführungszeichen gesetzten AnsiString zurück und verwendet als Anführungszeichen das in Quote angegebene Zeichen. Es wird am Anfang und Ende von AnsiString eingefügt. Sind bereits Anführungszeichen im AnsiString vorhanden, werden diese verdoppelt. Diese Funktion unterstützt Multibyte-Zeichen-AnsiStrings (MBCS).
"

Gruß, Andreas

DieDolly 5. Sep 2022 20:21

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Das funktioniert schonmal gut.
Aber leider macht das aus einem
Code:
x := '123' + sLineBreak + '456';
dann
Code:
x := '123'' + sLineBreak + ''456';
Alle anderen Hochkommas, die auch verdoppelt werden müssen, werden korrekt verdoppelt.

Delphi.Narium 5. Sep 2022 20:22

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Testdatei mit folgendem Inhalt:
Code:
X := '123' + '456' + sLineBreak + 'test' + sLineBreak + '.';
p'i
Pascalscript:
Delphi-Quellcode:
program Test;
var
  i : Integer;
  sl : tStringList;
  s : String;
begin
  sl := TStringList.Create;
  sl.LoadFromFile('c:\temp\test.test');
  for i := 0 to sl.Count - 1 do begin
    s := sl[i];
    s := AnsiReplaceStr(s,'''','''''');
    s := AnsiReplaceStr(s,' ''''',' ''');
    s := AnsiReplaceStr(s,''''' ',''' ');
    s := AnsiReplaceStr(s,''''';',''';');
    sl[i] := s;
  end;
  sl.SaveToFile('c:\temp\test.test.neu');
  sl.Free;
end.
Ausgabe:
Code:
X := '123' + '456' + sLineBreak + 'test' + sLineBreak + '.';
p''i
Eventuell als Ansatz zu gebrauchen?

DieDolly 5. Sep 2022 20:37

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Wird schwierig. Nicht alle Strings enden mit einem ';
Manche auch mit <Variable>;
Manchmal kann da auch stehen po' più, also nach dem ' ein Leerzeichen
und all so Sachen.

Ich muss da die Tage nochmal nach gucken.

Ich weiß da echt nicht weiter.

Der Eingabestring muss nicht so aussehen wie meiner in #1. Der kann auch dreckig sein, ohne Leerzeichen vor oder nach einem +.

Andreas13 5. Sep 2022 20:45

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Hi Dolly,
habe noch eine Idee für Dich: Du könntest in jeder Zeile die Anzahl der '-Zeichen zählen: Wenn die Anzahl UNgerade (= Odd) ist, nur dann sollst Du AnsiQuotedStr(..) benutzen. Denn bei geradzahligen '-Zeichen ist (wahrscheinlich) alles OK.
Schwachpunkt: Es könnte allerdings sein, daß eine Zeile zwei falsche Formatierungen hat... :oops:
Aber vielleicht bekommst Du den Löwenanteil damit hin und bleiben nur wenige Zeilen für die manuelle Korrektur übrig.

Grüße, Andreas

DieDolly 5. Sep 2022 20:47

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Die Wahrscheinlichkeit, dass das funktioniert, ist leider 50/50.
In Sprachen wie Italienisch und Französisch, kommen sehr viele von diesen ' mitten im Satz vor.
Trotzdem Danke für die Hilfe bis hierher.

Hier bin ich mittlerweile, der Rest später

Delphi-Quellcode:
EndsWithVariable := not S.EndsWith(''';');
S := Copy(S, 2, Length(S) - 2); // ' am Anfang und Ende entfernen

S := AnsiQuotedStr(S, ''''); // alle ' zu ''

S := AnsiReplaceStr(S, '+''', '+ '''); // +' zu + '
S := AnsiReplaceStr(PS, '''+', ''' +'); // '+ zu ' +

S := AnsiReplaceStr(S, ''''' +', ''' +'); // '' + zu ' +
S := AnsiReplaceStr(S, '+ ''''', '+ '''); // + '' zu + '

S := S + IfThen(EndsWithVariable, '', '''') + ';' // ' am Anfang und Ende (falls notwendig) wieder anfügen

Uwe Raabe 5. Sep 2022 21:38

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Zitat:

Zitat von DieDolly (Beitrag 1511280)
Aber leider macht das aus einem
Code:
x := '123' + sLineBreak + '456';
dann
Code:
x := '123'' + sLineBreak + ''456';

Kannst du mal den Code zeigen, der aus dem ersten String den zweiten macht?

himitsu 6. Sep 2022 00:08

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Zitat:

Zitat von DieDolly (Beitrag 1511280)
Alle anderen Hochkommas, die auch verdoppelt werden müssen, werden korrekt verdoppelt.

Das Delphi-Referenz durchsuchenQuotedStr muß natürlich jeweils auf die einzelnen Strings angewendet werden.

Es implementiert das Verhalten für "einen" Delphi-String, aber nicht für eine Kombination.

KodeZwerg 6. Sep 2022 09:29

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Zitat:

Zitat von DieDolly (Beitrag 1511282)
Manchmal kann da auch stehen po' più, also nach dem ' ein Leerzeichen
und all so Sachen.

Ich frage mich an der Stelle, da Du es ja anscheinend für einen Pascal Compiler aufbereiten sollst, was ist das "p'i 'pa po'" ?

Delphi.Narium 6. Sep 2022 10:11

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Tippe mal darauf, dass es sich um Quelltexte handelt, bei denen innerhalb von Zeichenfolgen bei 'nem ' das zweite ' fehlt, um einen korrekten Quelltext zu erhalten.
Delphi-Quellcode:
  if (Stringvariabel = 'a''a') then // <- müsste sein
  if (Stringvariabel = 'a'a') then // <- aber enthalten ist
aus demhier
Delphi-Quellcode:
  sQuelltext := 'Quelltext';
  s1 := 'Tippe mal darauf, ';
  s2 := 'dass es sich um ' + sQuelltext + 'e handelt, ';
  s3 := 'bei denen innerhalb von Zeichenfolgen '
  s4 := 'bei 'nem ' das zweite ' fehlt, ';
  s5 := 'um einen korrekten ' + sQuelltext + ' zu erhalten.';
  ShowMessage(s1 + s2 + s3 + s4 + s5);
soll dashier
Delphi-Quellcode:
  sQuelltext := 'Quelltext';
  s1 := 'Tippe mal darauf, ';
  s2 := 'dass es sich um ' + sQuelltext + 'e handelt, ';
  s3 := 'bei denen innerhalb von Zeichenfolgen '
  s4 := 'bei ''nem '' das zweite '' fehlt, ';
  s5 := 'um einen korrekten ' + sQuelltext + ' zu erhalten.';
  ShowMessage(s1 + s2 + s3 + s4 + s5);
werden.

Und das Ganze quasi für beliebige Quelltexte.

Und wie wir sehen, hat die Syntaxhervorhebung hier im Forum mit dem "Original" auch so ihre Probleme ;-)

DieDolly 6. Sep 2022 16:02

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Ich hole Strings aus einer Datei raus und packe sie in eine pas-Datei. In der Pas-Datei sind Dummy-Texte, die mit dem jeweiligen String der da hingehört ersetzt wird.
Das funktioniert seit vielen Monaten ohne Probleme.

Aber die Strings die ich aus der Uresprungsdatei raushole, können italienisch, französisch oder sonst was sein. Diese Sprachen haben oft ein ' irgendwo.
Die Strings können aber auch + sLinebreak + und sowas erhalten. Deswegen ist ein "einfach alle ' durch '' ersetzen" nicht möglich.

Blup 6. Sep 2022 16:17

AW: "Dreckige" Zeichenkette bereinigen und kompilierbar machen
 
Ich würde damit anfangen die Bedingug klar zu definieren und Testfälle aufzustellen.
Ist die Bedingung unvollständig oder falsch, kann auch das Ergebnis nicht in jedem Fall richtig sein.

Bedingung:
Im Text tritt diese Zeichenfolge auf:
[Buchstabe oder Ziffer][Hochkomma][beliebige Anzahl Leerzeichen(oder kein Leerzeichen)][Buchtstabe oder Ziffer]

Wenn Bedingung zutrifft, ersetze das Hochkomma durch zwei Hochkomma.
Die Bedingung kann an mehreren Stellen im Text auftreten.
Delphi-Quellcode:
uses
  StrUtils, WideStrUtils;

function IsBuchstabeOderZiffer(AValue: Char): Boolean;
begin
  Result := CharInSet(AValue, ['a'..'z', 'A'..'Z', '0'..'9']) or
            InOpArray(AValue, ['ä', 'ö', 'ü', 'Ä', 'Ö', 'Ü']);
end;

function HochkommaErgaenzen(const AValue: string): string;
const
  HOCHKOMMA = '''';
  SPACE = ' ';
var
  n1, n2, n3: Integer;
  c: Char;
begin
  Result := '';
  for n1 := 1 to Length(AValue) do
  begin
    c := AValue[n1];
    Result := Result + c;
    if IsBuchstabeOderZiffer(c) then
    begin
      {Hochkomma nach Buchstabe?}
      n2 := n1 + 1;
      if n2 <= Length(AValue) then
      begin
        c := AValue[n2];
        if c = HOCHKOMMA then
        begin
          {Leerzeichen nach Hochkomma überspringen}
          n3 := n2;
          repeat
            n3 := n3 + 1;
            if n3 <= Length(AValue) then
              c := AValue[n3]
            else
              c := #0;
          until c <> SPACE;
          {Buchstabe folgt Hochkomma (eventuelle nach Leerzeichen)}
          if IsBuchstabeOderZiffer(c) then
            Result := Result + HOCHKOMMA;
        end;
      end;
    end;
  end;
end;


Alle Zeitangaben in WEZ +1. Es ist jetzt 23:19 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz