AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein XML Delphi TXMLDocument probleme mit Umlauten
Thema durchsuchen
Ansicht
Themen-Optionen

TXMLDocument probleme mit Umlauten

Ein Thema von day · begonnen am 28. Aug 2006 · letzter Beitrag vom 29. Aug 2006
Antwort Antwort
day

Registriert seit: 10. Mai 2004
223 Beiträge
 
#1

TXMLDocument probleme mit Umlauten

  Alt 28. Aug 2006, 16:29
Hallo,
Ich verwende die TXMLDocument Komponente um eine XML-Struktur auszulesen. Jetzt enhält mein XML-File allerdings Umlaute. Beim Laden des Files bekomme ich eine EDOMParseException die besagt, dass ein ungültiger Character gefunden wurde.
Hat jemand eine Idee wie ich diese problem lösen kann? Kann dieser parser gar keine Umlaute?
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.171 Beiträge
 
Delphi 10.4 Sydney
 
#2

Re: TXMLDocument probleme mit Umlauten

  Alt 28. Aug 2006, 16:31
Ich vermute mal du hast deine Umlaute nicht XML-Konform codiert.
Zeig einfach mal deine XML-Datei auszugsweise (mit der Headerangabe zum Codierungsshema).
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
day

Registriert seit: 10. Mai 2004
223 Beiträge
 
#3

Re: TXMLDocument probleme mit Umlauten

  Alt 29. Aug 2006, 07:09
hallo
mit dem encoding="ISO-8859-1" hat es funktioniert. Aber warum geht es mit UTF-8 / 16 nicht. Die umlaute müssten dort doch auch enthalten sein. Wie sieht es aus mit japanischen sonderzeichen. Sind die im ISO-8859-1 enthalten?
    XMLDocument1.LoadFromStream(TStringStream.Create('<?xml version="1.0" encoding="ISO-8859-1"?> <process name="ä"> </process> '));
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.171 Beiträge
 
Delphi 10.4 Sydney
 
#4

Re: TXMLDocument probleme mit Umlauten

  Alt 29. Aug 2006, 07:37
Zitat von day:
hallo
mit dem encoding="ISO-8859-1" hat es funktioniert. Aber warum geht es mit UTF-8 / 16 nicht. Die umlaute müssten dort doch auch enthalten sein.
Sicherlich. Das ist kein Problem

<?xml version="1.0" encoding="UTF-8"?> <process name="ä"> </process> oder für ein CJK Unified Ideographs-Zeichen:

<?xml version="1.0" encoding="UTF-8"?> <process name="榖"> </process> Die Zeichen müssen natürlich entsprechend Codiert sein. Bei encoding="UTF-8" natürlich UTF-8-Codiert.

Zitat von day:
Wie sieht es aus mit japanischen sonderzeichen. Sind die im ISO-8859-1 enthalten?
Wenn Du das im ISO-8859-1 darstellen willst mußt du AFAIK die Hex-Codierung dafür nehmen (Ich glaube das müsste so sein :᭔ (Bitte nicht schlagen. Ich habe arbeite nur mit UTF-8-Codierten XML wo ich auch ab und zu mit einem Texteditor reinschaue, aber die sonstigen Codierungen überlasse ich meinen XML-Parser.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
Jürgen Thomas

Registriert seit: 13. Jul 2006
Ort: Berlin
750 Beiträge
 
#5

Re: TXMLDocument probleme mit Umlauten

  Alt 29. Aug 2006, 07:55
Zitat von day:
Wie sieht es aus mit japanischen sonderzeichen. Sind die im ISO-8859-1 enthalten?
Hallo,

für Umlaute dürfte die Auskunft von Bernhard Geyer vollständig sein.

Hiragana und Katakana könnten in ISO-8859-1 enthalten sein; ich weiß es nicht, halte es aber für eher unwahrscheinlich. Kanji (JIS) gehören mit Sicherheit nicht dazu; denn genau dafür wurde Unicode definiert. Lies einmal selbst in der XML-Referenz unter EncodingDecl nach; dort dürftest Du die benötigten Angaben finden.

Gruß Jürgen

PS. Um keine Unklarheiten aufkommen zu lassen: ich kann kein Japanisch, war aber bei der Herstellung des Japanisch-Lehrbuchs von Hadamitzky (jetzt bei Langenscheidt) beteiligt und habe dadurch einiges erfahren.
#D mit C# für NET, dazu Firebird
früher: Delphi 5 Pro, Delphi 2005 Pro mit C# (also NET 1.1)
Bitte nicht sauer sein, wenn ich mich bei Delphi-Schreibweisen verhaue; ich bin inzwischen an C# gewöhnt.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:33 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz