Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Sonstige Fragen zu Delphi (https://www.delphipraxis.net/19-sonstige-fragen-zu-delphi/)
-   -   Delphi 2-Byte-Characters lesen/ausgeben (Big Endian) (https://www.delphipraxis.net/133873-2-byte-characters-lesen-ausgeben-big-endian.html)

CalganX 11. Mai 2009 10:44


2-Byte-Characters lesen/ausgeben (Big Endian)
 
Hallo zusammen,

in der Datei, die ich mit einem TFileStream auslesen will, stehen Multibyte-/Unicode-Strings. D.h. alle Zeichen werden mit zwei Bytes kodiert. D.h. ich habe zum Beispiel folgenden Text in der Datei stehen (Hex-Code):
Code:
00 00 00 05 00 65 00 6E 00 2D 00 55 00 53
Die ersten vier Bytes geben mir die Länge des Strings an (i.e. 5 Zeichen). Dann folgen 10 Bytes (5 * 2 Bytes), die ich auslesen will.
Im Code sieht das jetzt bei mir so aus:
Delphi-Quellcode:
    fs.Read(bufSize, 4); bufSize := ChangeEndian32(bufSize);
    wbuf := StringOfChar(#00, bufSize*2);
    fs.Read(wbuf[1], bufSize*2);
    writeln('Locale: ', wbuf);
Dabei ist wbuf vom Typ WideString. Die Ausgabe ist dummerweise nur
Code:
Locale: ?????
Verwende ich UTF8String statt WideString bekomme ich immerhin eine Ausgabe. Die sieht jedoch so aus, als ob das zweite Byte nicht interpretiert wird (die Leerzeichen sind das Problem):
Code:
Locale: e n - U S
Kann das Problem im WideString-Fall damit zusammenhängen, dass die Datei im Big Endian-Format gespeichert ist oder bezieht sich das nur auf die Zahlwerte?
Wenn ja, wie kann ich geschickt einen String "umdrehen"? Meine ChangeEndian32-Routine (aus der Code-Lib übrigens) dreht nur DWORD-Werte um.

Gruß
Christopher

jfheins 11. Mai 2009 11:24

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
 
Lese das zeug in den Widestring ein und gehe jedes Zeichen durch und ändere die Endianess (^^) indem du WideChar auf Word castest, umdrehst dann wieder zurück castest.

CalganX 11. Mai 2009 11:29

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
 
Hi Julius,

Delphi-Quellcode:
function SwapBytes(X: WideChar): WideChar;
asm
  xchg al, ah
end;

function SwapString(X: WideString): WideString;
var
  idx: integer;
begin
  for idx := 0 to Length(X) - 1 do
    X[idx+1] := SwapBytes(X[idx+1]);
  Result := X;
end;
Das funktioniert. Und soweit ich das sehe, gibt es dafür auch keinen eleganteren Weg. Schade.

Danke für deine Hilfe.
Christopher

himitsu 14. Mai 2009 22:09

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
 
neee, 'ne einfache Lösung gibt's nicht wirklich ...

theoretisch könnte man es via MultiByteToWideChar und der passenden CodePage machen, aber leider nur theoretisch, denn praktisch geht's nicht :cry:

Zitat:

Zitat von himitsu
Unicode (ISO-10646-UCS-2) > CodePage: 1200
Unicode - Big Endian > CodePage: 1201


also bleibt nur der Weg des selbermachens, aber da ist es etwas unoptimal, wenn da auf jedes Zeichen direkt über den String zugegriffen würde, da Delphi dort dank der Compilermagic dort jedes Mal Einiges an Verwaltungskram einbaut...
Delphi-Quellcode:
function SwapString(const S: WideString): WideString;
var P, P2: PByte;
  i: Integer;
begin
  SetLength(Result, Length(S));
  P := Pointer(PWideChar(S));
  P2 := Pointer(PWideChar(Result));
  For i := Length(Result) - 1 downto 0 do Begin
    P[1] := P[0];
    P[0] := P[1];
    Inc(P, 2);
    Inc(P2, 2);
  End;
end;
weiß jetzt nicht ob das Pointer(...) unbedingt nötig ist ... ist es ja eigentlich nicht, also falls Delphi nicht meckert, dann einfach weglassen (bei Verwendung von P:PAnsiChar und C:AnsiChar würde Delphi zumindestens rumnörkeln)

oder direkt im String:
Delphi-Quellcode:
procedure SwapString(var S: WideString);
var P: PByte;
  C: Byte;
  i: Integer;
begin
  // UniqueString(S); // reinmachen, falls UnicodeString, anstatt WideString genutzt werden soll
  P := Pointer(PWideChar(S));
  For i := Length(S) - 1 downto 0 do Begin
    C   := P[0];
    P[0] := P[1];
    P[1] := C;
    Inc(P, 2);
  End;
end;


Alle Zeitangaben in WEZ +1. Es ist jetzt 23:09 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz