AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Escape sequenzen ersetzen

Ein Thema von manuel.taber · begonnen am 25. Aug 2011 · letzter Beitrag vom 11. Apr 2016
Antwort Antwort
Seite 1 von 2  1 2      
manuel.taber

Registriert seit: 15. Mär 2011
5 Beiträge
 
#1

Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:01
Hallo,

kurze Schilderung meines Problems:

Ich erhalte von einem Windows - Dienst (in Python geschrieben) über UDP eine Zeichenkette, die ich in Delphi weiter verarbeiten möchte. Um übertragungsprobleme zu vermeiden, wurden in der Zeichenkette die Sonderzeichen durch \x + Hex Wert ersetzt.

So ergibt z.B. 'äöü' die Zeichenkette '\xe4\xf6\xfc'.

Gibt es eine Möglichkeit, die originale Zeichenkette wiederherstellen?

Danke im voraus
Manuel
  Mit Zitat antworten Zitat
Benutzerbild von BUG
BUG

Registriert seit: 4. Dez 2003
Ort: Cottbus
2.094 Beiträge
 
#2

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:07
Ja, das sollte nicht so schwer sein.
Wie wird denn das Backslash selbst escapted?
Intellekt ist das Verstehen von Wissen. Verstehen ist der wahre Pfad zu Einsicht. Einsicht ist der Schlüssel zu allem.
  Mit Zitat antworten Zitat
manuel.taber

Registriert seit: 15. Mär 2011
5 Beiträge
 
#3

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:11
Das Backslash muss glaube ich nicht escaped werden, weil '\x' für das escapen hergenommen wird.
Ich kann mich aber auch irren...
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.142 Beiträge
 
Delphi 12 Athens
 
#4

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:19
spontan würde ich \\ für \ vermuten ... halt der normale C-Style




und Zurück:

Zeichencode auslesen und nach '\x'+2xHex umwandeln, außer bei #0 = '\0' oder #10 = '\n' oder '\' = '\\' usw.
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
manuel.taber

Registriert seit: 15. Mär 2011
5 Beiträge
 
#5

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:22
Gibt es keinen Parser oder ähnliches, der das für mich erledigt?
  Mit Zitat antworten Zitat
Benutzerbild von DeddyH
DeddyH

Registriert seit: 17. Sep 2006
Ort: Barchfeld
27.541 Beiträge
 
Delphi 11 Alexandria
 
#6

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:34
Vielleicht denke ich zu simpel, aber wieso nicht StringReplace? Das ist vielleicht nicht die schnellste Möglichkeit, aber wenn der Ausgangsstring nicht allzu lang ist, sollte das doch kein Problem sein.
Detlef
"Ich habe Angst vor dem Tag, an dem die Technologie unsere menschlichen Interaktionen übertrumpft. Die Welt wird eine Generation von Idioten bekommen." (Albert Einstein)
Dieser Tag ist längst gekommen
  Mit Zitat antworten Zitat
Benutzerbild von BUG
BUG

Registriert seit: 4. Dez 2003
Ort: Cottbus
2.094 Beiträge
 
#7

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:53
Wie wäre es wenn du den Parser schreiben würdest

Ich würde das mit einem endlichen Zustandsautomaten angehen:
Delphi-Quellcode:
function unescape(const input: AnsiString): AnsiString;
var
  state: (stNormal, stExpectX, stHex1, stHex2);
  curLength, cur: integer;
  escaped: string[3];

  procedure normal; inline;
  begin
    state := stNormal;
    inc(curLength);
    result[curLength] := input[cur];
  end;

begin
  setLength(result, length(input));
  curLength := 0;
  state := stNormal;
  for cur := 1 to length(input) do
  begin
    case state of
      stNormal:
        if input[cur] <> '\'
          then normal
          else state := stExpectX;
      stExpectX:
        if input[cur] = 'x'
          then state := stHex1
          else normal;
      stHex1:
        if input[cur] in ['0'..'9', 'a'..'f', 'A'..'F'] then
        begin
          escaped := '$' + input[cur];
          state := stHex2;
        end else normal;
      stHex2:
        begin
          if input[cur] in ['0'..'9', 'a'..'f', 'A'..'F']
            then escaped := escaped + input[cur]
            else state := stNormal;
          inc(curLength);
          result[curLength] := Chr(StrToInt(escaped));
          if state = stNormal
            then normal
            else state := stNormal;
        end;
    end;
  end;
  setLength(result, curLength);
end;
Nicht getestet, aber das Prinzip sollte klar werden.
Intellekt ist das Verstehen von Wissen. Verstehen ist der wahre Pfad zu Einsicht. Einsicht ist der Schlüssel zu allem.

Geändert von BUG (25. Aug 2011 um 16:46 Uhr) Grund: Code verbessert ...
  Mit Zitat antworten Zitat
gammatester

Registriert seit: 6. Dez 2005
999 Beiträge
 
#8

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 13:57
Zuerst müssen doch einmal die genauen Kodierungsregeln bekannt sein. Wie wird denn z.B.diese Original-Zeichenkette kodiert?
Code:
'äöü' wird als '\xe4\xf6\xfc' codiert!
Bei der Rückgewinnung sollte dann doch nicht herauskommen:
Code:
'äöü' wird als 'äöü' codiert!
  Mit Zitat antworten Zitat
Benutzerbild von BUG
BUG

Registriert seit: 4. Dez 2003
Ort: Cottbus
2.094 Beiträge
 
#9

AW: Escape sequenzen ersetzen

  Alt 25. Aug 2011, 14:09
Zuerst müssen doch einmal die genauen Kodierungsregeln bekannt sein.
Deswegen habe ich ja gefragt, wie '\' codiert wird.
Wenn das Prinzip klar ist, kann man aus stExpectX ein stExcpectModifier (oder so) machen und '\n', '\0' und andere ähnlich behandeln.

EDIT:
Ich habe den Code mal getestet und verbessert.
Wer mit Lazarus testet, sollte die Ausgabe besser mit AnsiToUtf8 behandeln.
Intellekt ist das Verstehen von Wissen. Verstehen ist der wahre Pfad zu Einsicht. Einsicht ist der Schlüssel zu allem.

Geändert von BUG (25. Aug 2011 um 16:50 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Sherlock
Sherlock

Registriert seit: 10. Jan 2006
Ort: Offenbach
3.763 Beiträge
 
Delphi 11 Alexandria
 
#10

AW: Escape sequenzen ersetzen

  Alt 8. Apr 2016, 12:12
Ich kram das hier mal aus der Versenkung, weil das fast auf mein Gegenwärtiges Problem zutrifft: Datenquelle ist ein Python YAML. Ich erhalte escapete Unicodestrings wie zum Beispiel 'Gl\xF6ckner' an Stelle von 'Glöckner'. YAML ist nix anderes als hübscheres JSON (überspitzt gesagt, ich nutze YAML eigentlich nur, weil es einen Datumstypen kennt, was unter Python ein Segen ist, da kennt JSON nämlich [Standardkonform] keinen). Zurück zu meinem Problem: Was hier geschildert wurde ist ein Eigenbau, den ich von einem "Web" und "IoT" affinen Konstrukt wie Delphi in der Reinkarnation Seattle als eingebaut angesehen hätte. Ich finde aber nicht wirklich etwas hilfreiches. Es gibt Vorschläge TJSONObject.ParseJSONValue zu verwenden. Das scheitert daran, daß mein YAML eben kein JSON ist, denke ich. Zumindest bleibt das JSON Objekt leer, nach dem Parsen des Strings.

Edith fand heraus, daß ParseJSONValue daran scheitert, daß \x nicht vorgesehen ist sondern nur \u...

Sherlock
Oliver
Geändert von Sherlock (Morgen um 16:78 Uhr) Grund: Weil ich es kann

Geändert von Sherlock ( 8. Apr 2016 um 12:39 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 21:06 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz