Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   GUI-Design mit VCL / FireMonkey / Common Controls (https://www.delphipraxis.net/18-gui-design-mit-vcl-firemonkey-common-controls/)
-   -   Delphi Problem mit Utf8Encode in D2009 (https://www.delphipraxis.net/123158-problem-mit-utf8encode-d2009.html)

Assertor 28. Okt 2008 17:20


Problem mit Utf8Encode in D2009
 
Hallo,

ich mache gerade ein paar Source-Reviews und stieß auf ein Problem mit der UTF8Encode Fkt. aus System.pas in Verbindung mit der VCL Unit EncdDecd.

Gegen sei folgender Source:

Delphi-Quellcode:
uses
  EncdDecd, Dialogs;
...
var
  s: UnicodeString; // bei D2006 ein WideString
begin
  s := 'Hätten Hüte ein ß im Namen, wären sie möglicherweise keine Hüte mehr,'+ sLineBreak +
    'sondern Hüße.' + sLineBreak;
  ShowMessage(EncodeString(UTF8Encode(s)));
end;
UTF8Encode ist unter D2009 prinzipiell überflüssig, wenn man eine Typzuweisung über tmpstr: Utf8String o.ä. macht. Das Ergebnis wird dadurch nicht verändert.

Nun zum Ausgabeergebnis:

D2006 (korrekt):
SMOkdHRlbiBIw7x0ZSBlaW4gw58gaW0gTmFtZW4sIHfDpHJlbi BzaWUgbcO2Z2xpY2hlcndlaXNl
IGtlaW5lIEjDvHRlIG1laHIsDQpzb25kZXJuIEjDvMOfZS4NCg ==

D2009:
SOR0dGVuIEj8dGUgZWluIN8gaW0gTmFtZW4sIHfkcmVuIHNpZS Bt9mdsaWNoZXJ3ZWlzZSBrZWlu
ZSBI/HRlIG1laHIsDQpzb25kZXJuIEj832UuDQo=

EncodeString arbeitet intern an dem String als Stream. Wenn man den Base64 aus D2009 umgekehrt, ist dieser sofort als Unicode lesbar (ohne UTF8Decode).

Was stimmt hier nicht? Verwende ich UTF8Encode falsch (wie gesagt Zuweisung über UTF8String bringt selbes Ergebnis).

Edit: Nachtrag. Es liegt nicht an EncdDecd, sondern defintiv an der Ausgabe von UTF8Encode. Gebe ich EncdDecd einen beliebigen String mit dem manuell UTF8-codierten String aus obigem Text, ist das Resultat identisch.

Dies führt zur Frage: Arbeitet UTF8Encode richtig in D2009? oder stehe ich gerade auf dem Schlauch nach so vielen Wochen Unicode?

Gruß Assertor

jfheins 28. Okt 2008 17:33

Re: Problem mit Utf8Encode in D2009
 
Erwartet EncodeString vll. einen String?

Dann könnte es sein, dass D2009 den UTF8 String automatisch in Unicode konvertiert (weil String ja UnicodeString ist, und du UTF8 übergibst ...)

siehe hier

Assertor 28. Okt 2008 17:38

Re: Problem mit Utf8Encode in D2009
 
Hi,

Zitat:

Zitat von jfheins
Erwartet EncodeString vll. einen String?

Dann könnte es sein, dass D2009 den UTF8 String automatisch in Unicode konvertiert (weil String ja UnicodeString ist, und du UTF8 übergibst ...)

Guter Ansatz, danke! Ich glaube auch das hier die CompilerMagic mir einen Strich durch die Rechnung macht. Der Link ist zwar brutal (viele obsolete Sachen enthalten, die in D2009 selbst oder besser gelöst sind).

Der Ansatz UTF8EncodeToShortString funktionert, aber ein ShortString ist sicher nicht lang genug.

Ich werde mal eine überladene EncodeString programmieren, mal sehen ob das hilft.

Gruß Assertor

Assertor 28. Okt 2008 17:47

Re: Problem mit Utf8Encode in D2009
 
So, des Problems Lösung:

Überladene Funktion für EncdDecd schreiben, die bei EncodeString mit UTF8String als Input arbeitet und dem TStringStream das Encoding manuell zuweisen:

Delphi-Quellcode:
function EncodeString(const Input: UTF8String): String; overload;
var
  InStr, OutStr: TStringStream;
begin
  InStr := TStringStream.Create(Input, TEncoding.UTF8);
  try
    OutStr := TStringStream.Create('');
    try
      EncodeStream(InStr, OutStr);
      Result := OutStr.DataString;
    finally
      OutStr.Free;
    end;
  finally
    InStr.Free;
  end;
end;
Die Ursache ist wirklich die automatische Rückwandlung von UTF8 zu Unicode. Danke Julius für die Idee!

Gruß Assertor


Alle Zeitangaben in WEZ +1. Es ist jetzt 17:39 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz