Delphi-PRAXiS
Seite 3 von 3     123   

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   HTTP.Get/Post - Umlaute anzeigen (https://www.delphipraxis.net/202509-http-get-post-umlaute-anzeigen.html)

Incocnito 14. Nov 2019 07:09

AW: HTTP.Get/Post - Umlaute anzeigen
 
Falls es dort auch um den Programminhalt geht, wären weitere "Sonderzeichen" nicht auszuschließen.
Du solltest wenigstens prüfen, ob der französische Zeichensatz (é, è, á, â, oder was es dort gibt)
auch mit drin ist bei deiner Konvertierung. Gerade europäische Titel werden gerne mal übernommen.
Auch wenn mir (dafür schau ich zu wenig TV) kein Beispiel einfällt. Ich denke auch gerade an
Dokumentationen über berühmte Personen, da gibt es sicherlich genug mit "Nicht-Deutschen-Zeichen".
Ich würde beim Sender Arte anfangen, da das ein französisch-deutscher Sender ist.
Der ist sicher ein gutes Testfeld. ;)

MfG Incocnito

Redeemer 14. Nov 2019 20:14

AW: HTTP.Get/Post - Umlaute anzeigen
 
Zitat:

Zitat von Incocnito (Beitrag 1451267)
Ich befürchte ein Fehler ist, dass es nur für \u0000 bis \u00FF funktioniert.
Wenn ich raten soll fehlt dir wenigstens \u0100 bis \uFFFF ... und wenn ich mich recht erinnere
hießen die Dinger "Multibyte-Zeichensätze", also könnte auch "\uFF1234" möglich sein, oder!?

Nein, gibt es nicht. Der Zeichensatz von JavaScript (intern und von \u-Escapes) ist UTF-16, der von Windows ist UTF-16 und der von WideString ist auch UTF-16. Ist zwar ein MBCS, interessiert aber nicht, da Quell- und Zielzeichensatz identisch sind. Da es anders als in HTML kein Abschlusszeichen gibt, muss die Länge der Sequenz von vornherein klar sein. Nach \u kommen immer vier Zeichen. C kennt \U mit acht Zeichen, JavaScript kennt das nicht: In Firefox gibt '\U00010400' keine sinnvolle Ausgabe, '\uD801\uDC00' hingegen schon. Somit ist es unmöglich, Zeichen als UCS-4BE (aka UTF-32BE) auszudrücken.

Der Thread ist doch eigentlich durch:
- Dem TE wurde ans Herz gelegt, eine richtige Bibliothek zu verwenden.
- Ich habe einen funktionierenden und korrekten Algorithmus gepostet.
Da muss man jetzt doch nicht weiter mit Halbwissen irritieren.

TERWI 17. Nov 2019 12:12

AW: HTTP.Get/Post - Umlaute anzeigen
 
@Incocnito
Du hast recht - mir ist aufgefallen, das auch etliche andere Zeichen kommen.
Z.B. diese hier:
Zitat:

\u00c9 -> É
\u00b0 -> °
\u0141 -> Ł
\u017e -> ž
\u00e9 -> é
\u2013 -> –
\u00df -> ß
\u00dc -> Ü
\u00fc -> ü
\u00e4 -> ä
\u00df -> ß
\u00f6 -> ö
Ich habe meine kleine Routine mal etwas universeller gemacht.
Nimmt und gibt nun einen String.
Ist kein Sonderzeichen drin, kommt der Text unverändert zurück.
Evtl. vorhandene '\u....' werden entsprechend ersetzt.
Delphi-Quellcode:
function DecodeJString(text : string) : string;
var
  p, val : word;
begin
  result := '';              // !
  p := Pos('\u', text);      // 1. Sonderzeichen suchen
  while (p > 0) do           // Sonderzeichen vorhanden ?
  begin
    val := hextoint(text[p + 2] + text[p + 3] + text[p + 4] + text[p + 5]); // Wert ermitteln
    result := result + copy(text, 1, p - 1) + widechar(val); // 1. Teil-String + Sonderzeichen
    Delete(text, 1, p + 5);  // zu 'Rest-String' löschen
    p := Pos('\u', text);    // noch mehr Sonderzeichen vorhanden ?
  end;
  result := result + text;   // (Rest-) String hinzufügen
end;
Viel einfacher & kürzer gehts wahrscheinlich nicht ...


Alle Zeitangaben in WEZ +1. Es ist jetzt 09:27 Uhr.
Seite 3 von 3     123   

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz