Delphi-PRAXiS
Seite 1 von 2  1 2      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Textdatei utf8-kodiert speichern! (https://www.delphipraxis.net/76573-textdatei-utf8-kodiert-speichern.html)

SirRobert 6. Sep 2006 12:12


Textdatei utf8-kodiert speichern!
 
Hallo zusammen,

ich habe eine Frage:
wie kann ich erzwingen (unabhängig vom Inhalt), dass ein String in eine UTF-8
codierte Textdatei gespeichert wird. Ich habe bereits mit Utf8Encode(mystr),
dann write(f, mystr) versucht, doch die Textdatei wird immer als ANSI gespeichert.

Für Eure Hilfe bedanke ich mich im voraus!


Grüße

Robert

Bernhard Geyer 6. Sep 2006 12:18

Re: Textdatei utf8-kodiert speichern!
 
Wie siehst du das es nur ANSI wäre?
Doch etwa nicht mit Notepad?
Für Notepad benötigst du nocht den Byte Order Mark für eine UTF8-Codierte Datei.

SirRobert 6. Sep 2006 12:26

Re: Textdatei utf8-kodiert speichern!
 
Hallo Bernhard,


doch, im Notepad! :)
Und diesen Byte Order Mark für eine UTF8-Codierte Datei bekomme ich
wie hin?

Übrigens, Danke für die schnelle Antwort!


Robert

SirRobert 6. Sep 2006 12:49

Re: Textdatei utf8-kodiert speichern!
 
Hat sich erledigt!

Schöne Grüße


Robert

Sherlock 10. Apr 2012 09:50

AW: Textdatei utf8-kodiert speichern!
 
Verdammt! Und genau hier hätte ich gerne gewusst, wie sich das erledigt hat. :evil:

Ich stehe vor einem sehr ähnlichen Problem. Ich bin im D2007 und hantiere mit UTF8Strings, die speicher ich dann irgendwann in ein TextFile (evtl. hier schon der Fehler?). Alles sieht im Editor nett aus, ein third-party-tool meckert auch erstmal nicht über das Format. Sobald Umlaute ins Spiel kommen, ist aber der Ofen aus. Das Tool jammert über "Ungueltiges Byte 2 von 3-Byte-UTF-8-Sequenz." und im NotePad++ (der übrigens annimmt, das wäre "UTF8 ohne BOM", stehen statt Umlauten Sonderzeichen...:pale:

Kurz gesagt: Hülfe?

Sherlock

himitsu 10. Apr 2012 10:01

AW: Textdatei utf8-kodiert speichern!
 
Du Schreibst das UTF-8-BOM in die Datei und hinten drann deinen als UTF-8 kodierten Text.

Ab D2009 sollte man besser den UTF8String oder den RawByteString verwenden, anstatt dem AnsiString.

Du mußt aber aufpassen, denn die alten Pascal-Prozeduren ala WriteLn arbeiten ausschließlich mit ANSI (auch in den neueren Unicode-Delphis) ... UTF8 kann zwar als ANSI behandelt werden, aber man sollte aufpassen, daß es nicht irgendwo zu einer automatischen Konvertierung kommt, bei einer Zuweisung von UTF8 an ANSI.


Ab D2009 hätte ich eine TStringList vorgeschlagen, welcher man das Encoding mitgeben kann.

Falls alles nichts hilft, schreib den UTF8String, inkl. BOM, in einen FileStream.

Sherlock 10. Apr 2012 10:05

AW: Textdatei utf8-kodiert speichern!
 
OK, das hatte ich befürchtet. TextFile und WriteLn geht nicht mit UTF8. Dann schau ich, daß ich das in einen hübschen Stream packe.

Danke, Himitsu.

Sherlock

himitsu 10. Apr 2012 10:18

AW: Textdatei utf8-kodiert speichern!
 
Es geht schon mit UTF8.

Man muß eben nur etwas aufpassen.

Sherlock 10. Apr 2012 10:53

AW: Textdatei utf8-kodiert speichern!
 
Klar geht es, das hab ich ja gesehen, nur bei Umlauten wirds halt kriminell. Und da kann ich nicht wirklich aufpassen, bzw. das einzige wäre Umlaute umzuwandeln in ihr zweibuchstabiges Pendant. Oder was meinst Du?

Mit dem Stream stosse ich übrigens auf andere Geschichten. Ich gebe zu, ich habe bisher Texte nur als TextFiles gespeichert und TFileStream nie verwendet.

Mein Versuch:
Delphi-Quellcode:
var ExportText : UTF8String;
    myfStream : TFileStream;
.
.
.
      fExpFileName := fDateiPfad + GUIDohneKlammern + '.xml';
      myfStream := TFileStream.Create(fExpFileName, fmCreate);

      ExportText := #239 + #187 + #191 + ExportText;  // Ist das ausreichend als BOM?

      myfStream.Write(ExportText,Length(ExportText));
Führt zu einer unleserlichen Datei. Muss ich mit dem BOM noch was anderes anstellen? Ist das die Falsche Art den BOM einzufügen?

Sherlock

himitsu 10. Apr 2012 11:10

AW: Textdatei utf8-kodiert speichern!
 
Delphi-Quellcode:
// besser als explizite Unicodeangabe, also 4-stellig, damit keine Codepage in die Quere kommen kann
ExportText := #$00EF#$00BB#$00BF + ExportText;

// oder gleich das korrekte Zeichen (das #$FEFF ist der Unicodemarker ... all diese Text-BOMs sind dieses Zeichen, nur eben entsprechend kodiert)
ExportText := UTF8Encode(#$FEFF) + ExportText;

z.B. #$0085 ist nicht #$85 ... das hatte mich mal veräppeln wollen :cry:


Alle Zeitangaben in WEZ +1. Es ist jetzt 04:38 Uhr.
Seite 1 von 2  1 2      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz