Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   XML - Fehlerhafte UTF-8-Codierung (https://www.delphipraxis.net/53346-xml-fehlerhafte-utf-8-codierung.html)

Bernhard Geyer 14. Sep 2005 15:41


XML - Fehlerhafte UTF-8-Codierung
 
Ich habe eine XML-Datei mit folgenden Inhalt (Beispielhaft).

XML-Code:
<?xml version="1.0" encoding="UTF-8" ?>
<Test>
  <Element>Test à‚°</Element>
  <Element>Test °</Element>
</Test>
Jedoch ist nach meinem Verständnis (und des von meinem Parser (OpenXML)) die erste Text im Element-Tag fehlerhaft Codiert. Diverse XML-Testsseiten sind auch dieser Meinung. IE stört sich nicht daran aber Firefox bemängelt ebenfalls diese Codierung.

Meine Vermutung. Beim dekodieren dieser nicht Well Formed-Angabe kommen z.B. der IE auf einen Unicode-Wert von #$E00B0 und "erleidet" einen WORD-Overflow, so das dann der korrekte Unicode-Wert #$00B0 herauskommt.

Gibt es eine XML-UTF8-Codierungsregel die diese Angabe erlaubt? Die Utf8ToUnicode-Funktion in System.pas codiert die Daten ebenfalls so falsch, da es ein Abschneiden von 32-Bit nach 16-Bit erleidet.

marabu 14. Sep 2005 20:19

Re: XML - Fehlerhafte UTF-8-Codierung
 
Hallo Bernhard,

mit $Exxxx bist du scheinbar in die tags section gerutscht: klick

Grüße vom marabu

Bernhard Geyer 14. Sep 2005 20:45

Re: XML - Fehlerhafte UTF-8-Codierung
 
Zitat:

Zitat von marabu
mit $Exxxx bist du scheinbar in die tags section gerutscht: klick

Nicht ganz. Dies Tags sind nur bis $E007F definiert.
Und von $E0080..$E00FF ist nichts definiert.


Alle Zeitangaben in WEZ +1. Es ist jetzt 04:32 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz