![]() |
Re: Ascii oder Ansi
Zitat:
|
Re: Ascii oder Ansi
Es ist doch einfach.
Nur das Programm, welches die Daten erstellt (und vielleicht wieder ließt) entscheidet/weiß 100%ig was für ein Format die Daten in der Datei haben. ANSI und ASCII sind halt nur Interpretationen der BYTEs (8-Bit-Daten). Wenn also keine Definition (um welche Daten es sich genau handelt) in der Datei vorhanden sind, dann gibt es keine sichere Möglichkeit zu prüfen um was es sich handelt. Für reine Textdateien sind aber auch schon verschiedene Markerbytes definiert: kein Markerbyte am Dateianfang = ANSI $FF $FE am Dateianfang = UniCode (Low Endian) $FE $FF am Dateianfang = UniCode (Big Endian) $FF $FE $00 $00 am Dateianfang = UniCode4 (Low Endian) $00 $00 $FE $FF am Dateianfang = UniCode4 (Big Endian) Du kannst es dir so vorstellen ... man nehme Byte, aber wie willst du entscheiden, was in diesem Byte steckt? ShortInt, Byte, AnsiChar, ASCII-Char, UTF8-Char, Boolean, Set ... |
Re: Ascii oder Ansi
Hallo,
Zitat:
$EF $BB $BF am Dateianfang = UTF8 Gruß xaromz |
Re: Ascii oder Ansi
Jupp, hatte es nur nicht mehr im Kopf -.-''
Und natürlich gibt es noch mehr, aber das sind dann wohl erstmal die Markerbytes, welche von den meisten Programmen erkannt werden (abgesehn vom UCS4) |
Re: Ascii oder Ansi
War UCS nicht inzwischen zugunsten von UTF "deprecated" deklariert worden (also alle UCS)?!
Nachtrag: Hah, ich habe eine Idee. "egal", versuche mal folgendes: öffne eine Bitmap-Datei mit deinem Lieblings-Bildbetrachter. Danach öffne die gleiche Datei mit Notepad und danach, insofern vorhanden, mit einem Hexeditor. Was siehst du? Richtig, die gleichen Daten, aber unterschiedlich repräsentiert. Und die Repräsentation ergibt sich daraus wie die Informationen/Daten dekodiert wurden. |
Re: Ascii oder Ansi
Das habe ich in einer PM an himitsu geschrieben:
Ich glaube ![]() Meine obige Aussage zu "allen UCS" trifft also nicht zu. Gemeint ist, daß UCS-2 nicht mehr benutzt werden soll (auch als Begriff), weil in UTF-16 Surrogates eingeführt wurden, die eben dann mehr als 2 Byte pro Zeichen lang sind ... deswegen wäre "Unicode Character String 2 Byte" (UCS 2) falsch. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:24 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz