Einzelnen Beitrag anzeigen

Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.171 Beiträge
 
Delphi 10.4 Sydney
 
#1

XML - Fehlerhafte UTF-8-Codierung

  Alt 14. Sep 2005, 15:41
Ich habe eine XML-Datei mit folgenden Inhalt (Beispielhaft).

XML-Code:
<?xml version="1.0" encoding="UTF-8" ?>
<Test>
  <Element>Test à‚°</Element>
  <Element>Test °</Element>
</Test>
Jedoch ist nach meinem Verständnis (und des von meinem Parser (OpenXML)) die erste Text im Element-Tag fehlerhaft Codiert. Diverse XML-Testsseiten sind auch dieser Meinung. IE stört sich nicht daran aber Firefox bemängelt ebenfalls diese Codierung.

Meine Vermutung. Beim dekodieren dieser nicht Well Formed-Angabe kommen z.B. der IE auf einen Unicode-Wert von #$E00B0 und "erleidet" einen WORD-Overflow, so das dann der korrekte Unicode-Wert #$00B0 herauskommt.

Gibt es eine XML-UTF8-Codierungsregel die diese Angabe erlaubt? Die Utf8ToUnicode-Funktion in System.pas codiert die Daten ebenfalls so falsch, da es ein Abschneiden von 32-Bit nach 16-Bit erleidet.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat