Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Delphi Seite auslesen komische Zeichen (https://www.delphipraxis.net/100246-seite-auslesen-komische-zeichen.html)

delphinia 25. Sep 2007 00:42


Seite auslesen komische Zeichen
 
lese mit der indiy idHTTP eine seite aus Wörter die öüä oder sonstiges haben....

Erhalte zb. so eine zeichenkombination... &#x27
Was soll ich damit anfange?! wie kann ich das so anzeigen wie es sein sollte?

Habe hier schon gesucht aber das was ich fand half nicht! vorallem das wohl ein Problem da ivh D5 habe

mkinzler 25. Sep 2007 06:43

Re: Seite auslesen komische Zeichen
 
Nein eher mit der Codierung des Datenstroms.

marabu 25. Sep 2007 06:46

Re: Seite auslesen komische Zeichen
 
Hallo Doreen,

vermutlich ist der Text der Seite in UTF8 kodiert. In der JEDI Unit JclUnicode findest du die Funktion Utf8ToWidestring(), mit der du den Text entschlüsseln kannst.

Grüße vom marabu

delphinia 25. Sep 2007 15:25

Re: Seite auslesen komische Zeichen
 
Zitat:

Zitat von marabu
Hallo Doreen,

vermutlich ist der Text der Seite in UTF8 kodiert. In der JEDI Unit JclUnicode findest du die Funktion Utf8ToWidestring(), mit der du den Text entschlüsseln kannst.

Grüße vom marabu

habe es probiert aber keien veränderung.
das wort "Träume" lese ich derzeit so Tr#228;ume


hmmmm

angos 25. Sep 2007 15:29

Re: Seite auslesen komische Zeichen
 
Hi Doreen,

das hat mit ASCII zu tun. :) das 228. Zeichen im ASCII-Zeichensatz ist das ä

hier kannst du das nachlesen

aber normalerweise müsste es diese Umwandlungsfunktionen speziell dafür geben (oder schreibst dir das anhand der ascii-tabelle selber, was umständlich wäre)


Gruß

boserPascal 25. Sep 2007 15:43

Re: Seite auslesen komische Zeichen
 
Eigentlich ist da gar nix kompliziert dran. Du suchst einfach nach der #, fügst alle folgenden Zeichen in einen String an bis zum ; . Danach führst du noch ein StrToInt aus und castest den Wert auf char. Das Ergebnis schreibst du dann an die Stelle von # bis ;.

Gruß!

Edit : verschrieben

marabu 25. Sep 2007 20:36

Re: Seite auslesen komische Zeichen
 
Hallo Doreen,

das Problem mit der UTF8-Kodierung wirst du vielleicht auch noch irgendwann haben, aber hätte ich genauer hingesehen, dann hätte ich in deinem ersten Beitrag schon die character entities erkennen können. Eine einfache Lösung findest du hier: klick

Gute Nacht


Alle Zeitangaben in WEZ +1. Es ist jetzt 04:37 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz