AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Unicode String nach Hex mit angabe der Codepage

Ein Thema von jarib · begonnen am 29. Jun 2011 · letzter Beitrag vom 30. Jun 2011
Antwort Antwort
Benutzerbild von Uwe Raabe
Uwe Raabe

Registriert seit: 20. Jan 2006
Ort: Lübbecke
11.658 Beiträge
 
Delphi 12 Athens
 
#1

AW: Unicode String nach Hex mit angabe der Codepage

  Alt 29. Jun 2011, 17:19
Ich erwarte allerdings für die Codepage 1251 (Kyrillisch): $043B, $0438, $043D, $0438, $044F
Da TBytes als array of Byte (8 Bit) deklariert ist, können da unmöglich Werte wie $043B (16 Bit) drinstehen.

Wenn ich aber mal einen string definiere als

Delphi-Quellcode:
const
  sTest: string = #$043B#$0438#$043D#$0438#$044F;
und mir diesen String anzeigen lasse, dann kommen da kyrillische Buchstaben raus, die laut Google Translate sowas wie "Linie" bedeuten.

Du glaubst aber nicht, daß TEncoding eine Übersetzung des Strings liefert?
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.384 Beiträge
 
Delphi 12 Athens
 
#2

AW: Unicode String nach Hex mit angabe der Codepage

  Alt 29. Jun 2011, 17:38
Jupp, eine Ansi-Codepage 1251 wird immer nur ein Byte pro Zeichen haben, außer bei einigen Multibyte-Codepages.

Aber auch Unicode kann man in einem ByteArray ablegen ... immer 2 Byte pro Zeichen.
PS: Ord(MyString[Zeichenindex]) , bei einem Unicodestring würde auch noch gehen.
Ein Therapeut entspricht 1024 Gigapeut.
  Mit Zitat antworten Zitat
Benutzerbild von Uwe Raabe
Uwe Raabe

Registriert seit: 20. Jan 2006
Ort: Lübbecke
11.658 Beiträge
 
Delphi 12 Athens
 
#3

AW: Unicode String nach Hex mit angabe der Codepage

  Alt 29. Jun 2011, 17:42
Jupp, eine Ansi-Codepage 1251 wird immer nur ein Byte pro Zeichen haben, außer bei einigen Multibyte-Codepages.

Aber auch Unicode kann man in einem ByteArray ablegen ... immer 2 Byte pro Zeichen.
PS: Ord(MyString[Zeichenindex]) , bei einem Unicodestring würde auch noch gehen.
Wie gesagt: die Hex-Sequenz, die er erwartet, entspricht der kyrillischen Übersetzung von "Zeile"...
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat
Thom

Registriert seit: 19. Mai 2006
570 Beiträge
 
Delphi XE3 Professional
 
#4

AW: Unicode String nach Hex mit angabe der Codepage

  Alt 30. Jun 2011, 00:51
Da TBytes als array of Byte (8 Bit) deklariert ist, können da unmöglich Werte wie $043B (16 Bit) drinstehen.
Wie ist es dann möglich, daß TStringStream einen UTF8-/Ansi-/WideString in einem TBytes-Array speichern kann?
Thomas Nitzschke
Google Maps mit Delphi
  Mit Zitat antworten Zitat
Benutzerbild von Uwe Raabe
Uwe Raabe

Registriert seit: 20. Jan 2006
Ort: Lübbecke
11.658 Beiträge
 
Delphi 12 Athens
 
#5

AW: Unicode String nach Hex mit angabe der Codepage

  Alt 30. Jun 2011, 07:42
Da TBytes als array of Byte (8 Bit) deklariert ist, können da unmöglich Werte wie $043B (16 Bit) drinstehen.
Wie ist es dann möglich, daß TStringStream einen UTF8-/Ansi-/WideString in einem TBytes-Array speichern kann?
Ich habe ja nicht behauptet, daß man WideStrings nicht in TBytes packen kann. Es ist nur nicht möglich, daß in TBytes Werte wie ($043B, $0438, $043D, $0438, $044F) stehen. Möglich ist aber eine solche Darstellung: ($3B, $04, $38, $04, $3D, $04, $38, $04, $4F, $04). Dies entspricht aber 1:1 der binären Darstellung des Unicode-Strings "линия". Wie man allerdings erwarten kann, daß TEncoding bei einem Input von "Zeile" die binäre Darstellung von "линия" zurückgeben soll, ist mir nicht ganz klar. Das ist eigentlich eine Aufgabe für ein Übersetzungswörterbuch. Solange ein solchen Unicode-basiert ist, braucht man sich um Codepages aber gar nicht zu kümmern.
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 07:28 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz