AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein UTF-8 codierte Zeichen im Quelltext verwenden und in Unicode decodieren
Thema durchsuchen
Ansicht
Themen-Optionen

UTF-8 codierte Zeichen im Quelltext verwenden und in Unicode decodieren

Ein Thema von Papaschlumpf73 · begonnen am 17. Mai 2023 · letzter Beitrag vom 19. Mai 2023
Antwort Antwort
mensch72

Registriert seit: 6. Feb 2008
838 Beiträge
 
#1

AW: UTF-8 codierte Zeichen im Quelltext verwenden und in Unicode decodieren

  Alt 17. Mai 2023, 12:48
wandle dir den Inhalt deiner XSD via BASE64 in einfachen ASCII-Text... den kannst du simpel im Delphieditor als 'Base64-Text' einfügen und als "const" oder beliebige String Zuweisung nutzen
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.550 Beiträge
 
Delphi 12 Athens
 
#2

AW: UTF-8 codierte Zeichen im Quelltext verwenden und in Unicode decodieren

  Alt 17. Mai 2023, 14:38
¨ (nicht ") und · sind etwas Speziell.

Bei Allem was nicht ASCII ist (#0...#127), muß man etwas aufpassen.
In welcher Codierung wurde die PAS gespeichert?
UTF-8 mit BOM wäre angebracht.

Oder du codierrst im Text es entsprechend

const B='( |''|[,-\.]|[A-Z]|[`-z]|~|'#168'|´|'#183'...';
In unserer deutschen Codepage / Font liegen diese Zeichen im 8. Bit (bis #255).

Auch kommt es im Delphi darauf an, wie etwas interpretert wird, vor allem bezüglich ANSI und Unicode.
Delphi-Quellcode:
C := '·';
C := #183;
C := #$87;
C := #$0087; // ja, es sieht gleich aus, wie das davor, aber der Compiler interpretiert das eine als ANSI und das andere als Unicode.
// Das Eine wird also bei Übergabe an einen String/UnicodeString zur Laufzeit jedes Mal mit "aktueller" Codepage konvertiert und der andere Wert wird direkt reingeschrieben.
// Führende Nullen mögen mathematisch egal sein, aber logisch sind sie nicht immer irrelevant.

Besser wäre es diese Zeichen im höheren Unicoderaum zu suchen und jenen Code zu verwenden.
Im für deutsche Codepage geht es, aber z.B. in einem russischen oder chinesischen Windows (Codepage) sind an der Stelle andere Zeichen.

Außer es geht wirklich um den "ByteCode" und nicht um die optische Darstellung Repräsentation. (hier ist dann der richtig codierte Code besser, anstatt dem Zeichen)
Ein Therapeut entspricht 1024 Gigapeut.

Geändert von himitsu (17. Mai 2023 um 14:50 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:51 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz