AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Object-Pascal / Delphi-Language Delphi Byteweises Auslesen einer Unicode-codierten Datei
Thema durchsuchen
Ansicht
Themen-Optionen

Byteweises Auslesen einer Unicode-codierten Datei

Ein Thema von amigage · begonnen am 22. Mär 2007 · letzter Beitrag vom 23. Mär 2007
Antwort Antwort
amigage

Registriert seit: 11. Nov 2005
Ort: Leipzig
270 Beiträge
 
Delphi 11 Alexandria
 
#1

Byteweises Auslesen einer Unicode-codierten Datei

  Alt 22. Mär 2007, 09:26
Hallo,

ich bin mal wieder mit einem Problem unterwegs

Ich bin dabei, eine Binärdatei zu entschlüsseln.
Ich lese an einer bestimmten Stelle ein Byte aus, um die Länge der nachfolgenden Information zu erhalten und weiter zu verarbeiten. Ich habe jetzt aber das Problem mit dem Unicode.

zB. hat Byte 29 den Hexwert 00 und Byte 30 den Hexwert 14.
Die Umwandlung des Bytes 30 ergibt somit einen Dezimalwert von 20, also die Länge meines nachfolgenden Datensatzes.

Wie rechne ich aber die beiden Bytes zusammen um auch einen Wert höher 256 zu erhalten?

Delphi-Quellcode:
var
  fsIN : TFileStream;
  wHeader : Word;
begin
  fsIN := TFileStream.Create('D:\temp\meineBinärdatei.xyz', fmOpenRead);
  try
    fsIN.Seek(28, soFromBeginning);
    fsIN.Read(wHeader, SizeOf(wHeader));

    ShowMessage(IntToHex(wheader, SizeOf(wHeader)));
    showmessage(IntToStr(wheader));
  finally
    FreeAndNil(fsIN);
  end;
end;
Kann mir einer sagen, was ich tun muss, um den Unicode-Wert aus den Bytes 29 und 30 als String zu erhalten, den ich dann in einer weiteren Funktion (z.B. die hier im Forum erwähnte "function UnicodeToAnsi(SubUnicode: string):string;" ) umwandeln kann?

Besten Danke für jeden Hinweis.
Amigage
  Mit Zitat antworten Zitat
Klaus01

Registriert seit: 30. Nov 2005
Ort: München
5.755 Beiträge
 
Delphi 10.4 Sydney
 
#2

Re: Byteweises Auslesen einer Unicode-codierten Datei

  Alt 22. Mär 2007, 09:34
Sollte so gehen:

Byte 29 * 256 + byte 30

Grüße
Klaus
Klaus
  Mit Zitat antworten Zitat
Benutzerbild von Gausi
Gausi

Registriert seit: 17. Jul 2005
847 Beiträge
 
Delphi 11 Alexandria
 
#3

Re: Byteweises Auslesen einer Unicode-codierten Datei

  Alt 22. Mär 2007, 09:39
Wobei man darauf achten muss, wie die Bytes geordnet sind. Häufig findet man am Anfang einer Unicode-Datei einen Byte-Order-Marker. Auch im ID3Tag bei Mp3-Dateien findet man diesen Marker. Dieser ist entweder $FEFF oder $FFFE, sodass die Berechnung entweder "Byte 29 * 256 + byte 30" oder "Byte 29 + byte 30 * 256" ablaufen muss.
  Mit Zitat antworten Zitat
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#4

Re: Byteweises Auslesen einer Unicode-codierten Datei

  Alt 22. Mär 2007, 09:54
Delphi-Quellcode:
var
  fsIN : TFileStream;
  wHeader : Word;
  Daten : WideString; // <====
begin
  SetLength(Daten, 30);
  fsIN := TFileStream.Create('D:\temp\meineBinärdatei.xyz', fmOpenRead);
  try
    fsIN.Seek(28, soFromBeginning);
    fsIN.Read(@Daten[1], Length(Daten) * sizeof(Widechar));

    ShowMessage(Daten);
  finally
    FreeAndNil(fsIN);
  end;
end;
Gausi hat natürlich recht; man muss Byte-Reihenfolge beachten.
Sollte diese Reihenfolge nicht zum Intel-Format passen, dann verwendet man einfach folgende
Procedure:
Delphi-Quellcode:
// Hilfsfunktion zum vertauschen der Byteorder in einem WideString
procedure SwapWideString(var ws:WideString);
var
   i : Integer;
begin
   for i := 1 to length(ws) do
      ws[i] := WideChar(Swap(Ord(ws[i])));
end;
Andreas
  Mit Zitat antworten Zitat
amigage

Registriert seit: 11. Nov 2005
Ort: Leipzig
270 Beiträge
 
Delphi 11 Alexandria
 
#5

Re: Byteweises Auslesen einer Unicode-codierten Datei

  Alt 22. Mär 2007, 10:03
Danke für Eure schnellen Antworten und vor allem mit dem Hinweis auf das Byte Order Mark und den notwendigen Bytewechsel. Den hatte ich nämlich auch schon bemerkt und wusste nicht warum

Danke, ich werde es mal probieren.
  Mit Zitat antworten Zitat
Muetze1
(Gast)

n/a Beiträge
 
#6

Re: Byteweises Auslesen einer Unicode-codierten Datei

  Alt 23. Mär 2007, 00:56
Dein erster Code zeigte zu kurze Codes an: SizeOf() liefert Bytes zurück und IntToHex() will die Anzahl der Ziffern haben. Eine Ziffer bei IntToHex ist ein Nibble und somit müsstest du den SizeOf() Wert mal 2 nehmen für IntToHex().

Ausserdem weiss ich nicht, warum du einzelne Bytewerte multiplizieren willst, wo du diese doch schon kombiniert liest als ein Word. Hättest du zwei einzelne nachfolgende Bytes aus dem Stream gelesen, hätte ich den Grund verstanden, aber so
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:47 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz