AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein XML Delphi IXMLDocument und Sonderzeichen

IXMLDocument und Sonderzeichen

Ein Thema von Blamaster · begonnen am 25. Apr 2015 · letzter Beitrag vom 25. Apr 2015
Antwort Antwort
Blamaster

Registriert seit: 20. Jul 2007
230 Beiträge
 
#1

IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 12:38
Hi,

ich habe eine kurze Frage bezüglich Sonderzeichen und dem IXMLDocument.

Delphi-Quellcode:
procedure xmlTest();
var
  xml: IXMLDocument;
  rootNode, childNode: IXMLNode;
  logNode: IXMLNode;
  logMessage: string;
  logWideString: Widestring;
begin
  logMessage := 'Test äöüß<>"&';

  // write xml data
  xml := NewXMLDocument();
  xml.Encoding := 'iso-8859-1';
  xml.Options := [doNodeAutoIndent];
  rootNode := xml.AddChild('result');
  logNode := rootNode.AddChild('logData');
  logNode.AddChild('message').Text := logMessage;
  logWideString := xml.XML.Text;

  ShowMessage(logWideString);

  // read xml data
  xml := LoadXMLData(logWideString);
  rootNode := xml.DocumentElement;
  childNode := rootNode.ChildNodes[0];
  logWideString := childNode.childNodes['message'].Text;
  logMessage := logWideString;

  ShowMessage(logMessage);
end;
Das zwischenwandeln auf WideString ist lediglich enthalten da es der späteren Einsatzumgebung entspricht (xml wird vom Hauptprogramm erzeugt und als WideString an eine dll übergeben)

Das Erste ShowMessage gibt die Sonderzeichen alle in der korrekten XML Notation aus (&lt; &gt; ...)
Das zweite ShowMessage hingegen verschluckt das "&" Zeichen die anderen Sonderzeichen werden korrekt angezeigt. Woran liegt das ? Die Wandlung der unerlaubten Sonderzeichen in erlaubte XML Notation funktioniert ja scheinbar.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.017 Beiträge
 
Delphi 12 Athens
 
#2

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 14:40
Warum vergisst man eigentlich immer die wichtigsten Informationen?
  • Welche Delphi-Version?
  • Welche Windows-Version? (du verwendest hier der MS-XML-DOM und die Version hängt vom Windows ab)
  • Installierte Windows-Updates? (speziell welche XML-Versionen installiert sind)
  • Und vorallem was sagt der Debugger? (ist wirklich kein & im String drin)
    Für mein System kann ich bestätigen, daß das & im String und in der Memo-Ausgabe vorhanden ist.

Ach ja, außschließlich xml.SaveToStream und xml.SaveToFile beachten das Encoding.
Aber dir ist ja bestimmt noch nicht aufgefallen, daß in deinem logWideString kein Encodeing angegeben ist. (Standard ist UTF-8 und in diesem Fall von WideString natürlich UTF-16)
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests

Geändert von himitsu (25. Apr 2015 um 14:44 Uhr)
  Mit Zitat antworten Zitat
Blamaster

Registriert seit: 20. Jul 2007
230 Beiträge
 
#3

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 16:57
Zitat:
Welche Delphi-Version?
Delphi 7
Zitat:
Welche Windows-Version?
Windows 7
Zitat:
Installierte Windows-Updates?
Servicepack 1
Zitat:
Und vorallem was sagt der Debugger?
Debugger sagt das & Zeichen ist im logMessage String enthalten.
Wenn ich den Messagetext im Message Fenster mit Str+C Strg+V in einem Texteditor einfüge ist das & wieder da.

Zitat:
Für mein System kann ich bestätigen, daß das & im String und in der Memo-Ausgabe vorhanden ist.
Bedeutet das XML ist Systemabhängig ? Ich dache genau dafür ist XML da um plattformübergreifend zu kommunizieren. Genau dafür ist XML doch auch standardisiert. Wo liegt da der Ermessensspielraum für ein Windows-Update oder sonstiges aufeinmal den Standard anders auslegen zu wollen ?

Zitat:
Aber dir ist ja bestimmt noch nicht aufgefallen, daß in deinem logWideString kein Encodeing angegeben ist. (Standard ist UTF-8 und in diesem Fall von WideString natürlich UTF-16)
Ist das xml.Encoding := 'iso-8859-1' dann im Beispiel völlig überflüssig ?

Verstehe nicht was damit gemeint ist ? Bei der reinen Wandlung String -> WideString -> WideString -> String dürften doch eigentlich keine Informationen verloren gehen. Zumindest sagt das die Delphi Dokumentation so.

Geändert von Blamaster (25. Apr 2015 um 16:59 Uhr)
  Mit Zitat antworten Zitat
mjustin

Registriert seit: 14. Apr 2008
3.003 Beiträge
 
Delphi 2009 Professional
 
#4

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 17:46
Testweise würde ich das Dokument mal als Datei speichern und sehen, was Notepadd++ als Kodierung erkennt: iso-8859-1 oder utf-8?
Michael Justin
  Mit Zitat antworten Zitat
Blamaster

Registriert seit: 20. Jul 2007
230 Beiträge
 
#5

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 18:04
Hi,

Notepad++ erkennt es als iso-8859-1

Edit.

Aber wenn das encoding sich wirklich nur auf xml.SaveToStream und xml.SaveToFile beziehen dürfte das ja auch keinen Unterschied machen.
Was aber viel interessanter ist. Ich konnte das Problem noch weiter reduzieren. Wie es aussieht das die XML und WiderString Geschichte nicht mit dem eigentlichen Problem zu tun.

Nichtmal das hier funktioniert:
Delphi-Quellcode:
logMessage: String;
logMessage := 'Test äöüß<>"&';
ShowMessage(logMessage);
Auch dabei wird das "&" nicht angezeigt. Zusätzlich ist mir noch aufgefallen das wenn das & nicht am Ende steht sondern am Anfang sprich logMessage := '&Test äöüß<>"'; dann wird im ShowMessage Fenster das T mit einem Strich drunter angezeigt.

Geändert von Blamaster (25. Apr 2015 um 18:27 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.017 Beiträge
 
Delphi 12 Athens
 
#6

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 18:49
XML ist systemunabhängig, aber nicht alle "String"-Ausgaben sind unabhängig, sondern "absichtlich" für das jeweilige Ausgabemedium ausgelegt ... drum ist in xmldoc.xml.irgendwas der String vor D2009 immer ANSI und danach immer Unicode, da .XML eine TStringList ist.

Siehe Delphi-Referenz durchsuchenTLabel.ShowAccelChar: Es gibt einige Komponenten, welche das & etwas anderes behandeln, beim Anzeigen, darum sollte man da erstmal im Debugger nachsehn, was wirklich im String ist.
Dazu zählen z.B. einige ältere Dialoge, wie z.B. ShowMessage, wo intern auch ein TLabel für die Anzeige genutzt wurde und bei dem man vergaß diese &-Behandlung zu deaktieren.
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests

Geändert von himitsu (25. Apr 2015 um 18:52 Uhr)
  Mit Zitat antworten Zitat
Blamaster

Registriert seit: 20. Jul 2007
230 Beiträge
 
#7

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 19:11
Okay vielen Dank das erklärt natürlich das gezeigte Verhalten

Nochmal eine Rückfrage zu folgendem Punkt:

Zitat:
Ach ja, außschließlich xml.SaveToStream und xml.SaveToFile beachten das Encoding.
Heißt das wirklich das ich das xml.Encoding := 'iso-8859-1' nicht benötige ? Im Kopf des XML String wird es ja gesetzt.

<?xml version="1.0" encoding="iso-8859-1"?> Ich hatte jetzt vermutet das hier das encoding benötigt wird um sicher zu gesehen das die Gegenseite sprich die dll an die der XML-String als WideString übergeben wird weiß wie die Zeichen zu interpretieren sind. (Die dll könnte ja durchaus in einer andere Programmiersprache oder einer anderen Delphi Version erstellt werden also mit anderem default Zeichensatz)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.017 Beiträge
 
Delphi 12 Athens
 
#8

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 20:20
Wenn der Text/String immer als Unicode (WideString aka UTF-16 oder als UTF-8) behandelt wird, dann ist das nicht nötig.
Es wäre sogar "falsch", wenn iso-8859-1 drinstünde und es dann doch als Unicode-Text gespeichert würde, drum lässt MS-XML dabei auch das Encoding weg.

xmldoc.SaveToString in einen WideString/UnicodeString ist immer Unicode, genauso wie seit Delphi 2009 auch xmldoc.xml.Text .

XML-Dateien, bzw. ANSI-Strings ohne Encodingangabe sind per Standard UTF-8.
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
Blamaster

Registriert seit: 20. Jul 2007
230 Beiträge
 
#9

AW: IXMLDocument und Sonderzeichen

  Alt 25. Apr 2015, 21:18
Okay vielen Dank
  Mit Zitat antworten Zitat
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:10 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz