Delphi-PRAXiS
Seite 1 von 2  1 2      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   XML (https://www.delphipraxis.net/46-xml/)
-   -   Delphi Sonderzeichen fehlen beim Auslesen einer XML (https://www.delphipraxis.net/158489-sonderzeichen-fehlen-beim-auslesen-einer-xml.html)

hitz 19. Feb 2011 14:22

Sonderzeichen fehlen beim Auslesen einer XML
 
Hallo,

ich habe ein Problem beim Auslesen folgender XML:

Code:
<?xml version="1.0" encoding="utf-8"?>
<!-- comid136045 -->
<ArrayOfSpieler xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
  <Spieler>
    <Name>Matthias</Name>
    <AccountValue>7046800</AccountValue>
    <SpielerColor>0</SpielerColor>
    <SpielerPunkte>480</SpielerPunkte>
  </Spieler>
  <Spieler>
    <Name>Dennis</Name>
    <AccountValue>938900</AccountValue>
    <SpielerColor>0</SpielerColor>
    <SpielerPunkte>481</SpielerPunkte>
  </Spieler>
  <Spieler>
    <Name>René</Name>
    <AccountValue>3796080</AccountValue>
    <SpielerColor>0</SpielerColor>
    <SpielerPunkte>442</SpielerPunkte>
  </Spieler>
</ArrayOfSpieler>
Ich nutze Lazarus 0.9.28.2b und habe die units dom, xmlwrite und xmlread eingebunden. Ich lese die XML über 2 ineinander verschachtelte Schleifen in ein StringGrid. Das funktioniert auch, bis auf das "é" im Namen des Spielers "René". Das wird bereits beim Lesen aus der XML "verschluckt". Woran liegt das und wie kann ich das beheben?
Vielen Dank schonmal für eure Hilfe!

himitsu 19. Feb 2011 14:46

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
é ist definitiv keine UTF-8-Darstellung, also scheint die XML-Datei fehlerhaft zu sein.

Bernhard Geyer 19. Feb 2011 14:50

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Es kommt jetzt darauf an ob die Datei wirklich so aussieht oder das das Ergebnis einer Anzeige mit Notepad/IE/Firefox + Copy-Aktion ins Forum ist. Poste doch mal die Orginal-XML-Datei als Anhang.

hitz 19. Feb 2011 14:58

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Liste der Anhänge anzeigen (Anzahl: 1)
Ich habs mit dem Win7 Editor geöffnet und rauskopiert und etwas gekürzt, in der originalen XML sind mehr Spieler vorhanden (s. Anhang).

Aber egal wie ich es öffne, das é ist da... Gibts da keine Möglichkeit das utf8-konform zu machen?

-187- 19. Feb 2011 15:18

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Hm das ist keine valide XML Datei. Du solltest vorher die Sonderzeichen ersetzen.

Bsp:
Delphi-Quellcode:
StrList.Strings[i]:=StringReplace(StrList.Strings[i], 'é', '&eacute;',[rfReplaceAll, rfIgnoreCase]);

himitsu 19. Feb 2011 15:36

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Die XML-Datei scheint ordentlich codiert zu sein.

Wie ließt du denn die Datei ein?

hitz 19. Feb 2011 15:50

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Ich lese die XML in ein StringGrid ein, die Anweisung zur unterschiedlichen Farbdarstellung habe ich mal rausgenommen:

Code:
var
   Dok : TXMLDocument;
   i, j, farbwert: Integer;
   s : string;

begin
   ReadXMLFile(Dok, pfad);
   Form1.StringGrid1.RowCount := Dok.documentElement.ChildNodes.Count+1;
   with Dok.DocumentElement.ChildNodes do
   begin
        for i := 0 to Count-1 do
        begin
             for j := 0 to Item[i].ChildNodes.Count-1 do
             begin
                  s := Item[i].ChildNodes.Item[j].FirstChild.NodeValue;
                  case j of
                  0,1 : begin
                           Form1.StringGrid1.Cells[j,i+1] := s;
                    end;
                  2 : begin
                           farbwert := strtoint(s);
                           case farbwert of
                           [.....]
                    end;
                  3 : begin
                           Form1.StringGrid1.Cells[j-1,i+1] := s;
                    end;
                  end;
             end;
        end;
   end;
   Dok.Free;
end;

himitsu 19. Feb 2011 16:00

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
hmm, sieht soweit ok aus, hätte ja sein können, daß du dieses erstmal selber einließt und dann erst ans XML-DOM übergibst.

Als ein Problem bei Lazarus empfand ich die komische Mischung von UTF8String und anderen Stringtypen,
da müßtest du mal nachsehn, ob da nun alles stimmt.
> Was für ein Typ ist denn "string" (also intern) und wie sieht es mit NodeValue und Cell aus?

hitz 19. Feb 2011 16:19

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Ich glaube Lazarus ist standardmäßig auf utf8 eingestellt, jedenfalls sagt mir das meine kurze Suche im Internet. Dabei bin ich auch auf den Befehl utf8encode() gestoßen und habe den eingefügt:
Code:
aus
s := Item[i].ChildNodes.Item[j].FirstChild.NodeValue;
wurde
s := utf8encode(Item[i].ChildNodes.Item[j].FirstChild.NodeValue);
Und was soll ich sagen? Es funktioniert, nur warum weiß ich nicht :D

/edit: Könnte es sein, dass die .NodeValue einen nicht-utf8 string ausgibt, obwohl in der XML utf8 verwendet wird?

Bernhard Geyer 19. Feb 2011 16:21

AW: Sonderzeichen fehlen beim Auslesen einer XML
 
Zitat:

Zitat von hitz (Beitrag 1082904)
Ich glaube Lazarus ist standardmäßig auf utf8 eingestellt, jedenfalls sagt mir das meine kurze Suche im Internet. Dabei bin ich auch auf den Befehl utf8encode() gestoßen und habe den eingefügt:

Lazarus hat UTF8 als Standard-Unicodecodierung gewählt. Aber es gibt scheinbar noch genügend Stellen an denen einmal zu viel oder zu wenig utf8encode/utf8decode aufgerufen wird. Hatten in letzten Zeit öfter schon UTF8/Unicodefragen die auf Implementierungsfehler zurückzuführen waren.


Alle Zeitangaben in WEZ +1. Es ist jetzt 02:15 Uhr.
Seite 1 von 2  1 2      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz