Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   FreePascal (https://www.delphipraxis.net/74-freepascal/)
-   -   Textdateien mit Umlauten im Inhalt (https://www.delphipraxis.net/157654-textdateien-mit-umlauten-im-inhalt.html)

Phillie08 19. Jan 2011 19:51

Textdateien mit Umlauten im Inhalt
 
Nach langen Jahren Pause wollte ich mal wieder was mit Delphi machen, habe dann Lazarus gefunden, und bin an folgendem Problem hängen geblieben:
Ich möchte Textdateien in ein Memo einlesen, bearbeiten und dann wieder zurückschreiben. Wäre kein Problem, wenn das Memo Umlaute lesen könnte. Sie werden sämtlich durch ein "?" ersetzt.
Ich habe verschiedene CharSets bei Eigenschaft Font ausprobiert, alles mit dem nämlichen Ergebnis.
Hat jemand eine Idee?

mkinzler 19. Jan 2011 19:53

AW: Textdateien mit Umlauten im Inhalt
 
Welcher Charset? ANSI oder ASCII?

Luckie 19. Jan 2011 21:06

AW: Textdateien mit Umlauten im Inhalt
 
Unicode?

JamesTKirk 20. Jan 2011 14:49

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von Phillie08 (Beitrag 1075905)
Nach langen Jahren Pause wollte ich mal wieder was mit Delphi machen, habe dann Lazarus gefunden, und bin an folgendem Problem hängen geblieben:
Ich möchte Textdateien in ein Memo einlesen, bearbeiten und dann wieder zurückschreiben. Wäre kein Problem, wenn das Memo Umlaute lesen könnte. Sie werden sämtlich durch ein "?" ersetzt.
Ich habe verschiedene CharSets bei Eigenschaft Font ausprobiert, alles mit dem nämlichen Ergebnis.
Hat jemand eine Idee?

Lazarus arbeitet standardmäßig mit UTF-8 Kodierung, während dein System (wahrscheinlich Windows) eine Ansikodierung verwendet. Du musst also vor der Zuweisung den Text in UTF-8 umkonvertieren:

Delphi-Quellcode:
begin
  DeinText := {lade Text aus Datei}
  Memo1.Lines.Text := SysToUTF8(DeinText); // alternativ sollte auch AnsiToUTF8 funktionieren
end;
Siehe dazu auch diese Seite des Lazarus Wikis

Gruß,
Sven

Phillie08 24. Jan 2011 12:15

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von JamesTKirk (Beitrag 1076131)

Lazarus arbeitet standardmäßig mit UTF-8 Kodierung, während dein System (wahrscheinlich Windows) eine Ansikodierung verwendet. Du musst also vor der Zuweisung den Text in UTF-8 umkonvertieren:

Delphi-Quellcode:
begin
  DeinText := {lade Text aus Datei}
  Memo1.Lines.Text := SysToUTF8(DeinText); // alternativ sollte auch AnsiToUTF8 funktionieren
end;
Siehe dazu auch diese Seite des Lazarus Wikis

Gruß,
Sven

Vielen Dank, das sieht vielversprechend aus.
Allerdings habe ich da denn doch noch ein Verständnisproblem:

Von welchem Typ ist "DeinText"? Oder gleich ausführlich: Wie realisiere ich

Phillie08 24. Jan 2011 12:20

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von JamesTKirk (Beitrag 1076131)

Lazarus arbeitet standardmäßig mit UTF-8 Kodierung, während dein System (wahrscheinlich Windows) eine Ansikodierung verwendet. Du musst also vor der Zuweisung den Text in UTF-8 umkonvertieren:

Delphi-Quellcode:
begin
  DeinText := {lade Text aus Datei}
  Memo1.Lines.Text := SysToUTF8(DeinText); // alternativ sollte auch AnsiToUTF8 funktionieren
end;
Siehe dazu auch diese Seite des Lazarus Wikis

Gruß,
Sven

Vielen Dank, das sieht vielversprechend aus.
Allerdings habe ich da denn doch noch ein Verständnisproblem:

Von welchem Typ ist "DeinText"?
Oder gleich ausführlich: Wie realisiere ich
DeinText := {lade Text aus Datei}?

Und wenn ich schon dabei bin, dumme Fragen zu stellen: Muss ich eigens eine Unit einbinden, in der SysToUTF8 deklariert ist, falls ja: welche?

In Hoffnung,
Andreas

DeddyH 24. Jan 2011 12:28

AW: Textdateien mit Umlauten im Inhalt
 
Genau lesen ;)
Zitat:

Zitat von Verlinkter Wiki-Artikel
The unit FileUtil defines common file functions with UTF-8 strings:


JamesTKirk 24. Jan 2011 20:24

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von DeddyH (Beitrag 1076857)
Genau lesen ;)
Zitat:

Zitat von Verlinkter Wiki-Artikel
The unit FileUtil defines common file functions with UTF-8 strings:


Selbiges gilt auch für dich :P

SysToUTF8/UTF8ToSys und AnsiToUTF8/UTF8ToAnsi sind in SysUtils oder gar System definiert (ich glaube allerdings System). Letztere musst du gar nicht einbinden (die ist immer verfügbar), die erstere ist meist eh schon eingebunden.

Die Funktionen in FileUtils sind UTF8 Wrapper um die Ansi Funktionen in SysUtils und Co.

Edit:
Da hätte ich doch glatt deine andere Frage vergessen:

Zitat:

Zitat von Phillie08 (Beitrag 1076855)
Von welchem Typ ist "DeinText"?
Oder gleich ausführlich: Wie realisiere ich
DeinText := {lade Text aus Datei}?

Delphi-Quellcode:
DeinText
ist vom Typ
Delphi-Quellcode:
String
. Um ihn zu bekommen kannst du zum Beispiel folgendes machen:

Delphi-Quellcode:
var
  slist: TStringList;
begin
  with TStringList.Create do
    try
      LoadFromFile(DeinDateiName); // ein String
      DeinText := Text;
    finally
      Free;
    end;
end;
Alternativ kannst du statt
Delphi-Quellcode:
DeinText
auch gleich
Delphi-Quellcode:
Memo1.Lines.Text := SysToUTF8(Text)
verwenden.

Gruß,
Sven

Phillie08 26. Jan 2011 17:08

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von JamesTKirk (Beitrag 1077005)
Zitat:

Zitat von Phillie08 (Beitrag 1076855)
Von welchem Typ ist "DeinText"?
Oder gleich ausführlich: Wie realisiere ich
DeinText := {lade Text aus Datei}?

Delphi-Quellcode:
DeinText
ist vom Typ
Delphi-Quellcode:
String
. Um ihn zu bekommen kannst du zum Beispiel folgendes machen:

Delphi-Quellcode:
var
  slist: TStringList;
begin
  with TStringList.Create do
    try
      LoadFromFile(DeinDateiName); // ein String
      DeinText := Text;
    finally
      Free;
    end;
end;
Alternativ kannst du statt
Delphi-Quellcode:
DeinText
auch gleich
Delphi-Quellcode:
Memo1.Lines.Text := SysToUTF8(Text)
verwenden.

Gruß,
Sven

Ich bin begeistert. Es klappt! Habe den zweiten, kürzeren Vorschlag verwendet.
Nur noch eine Bemerkung: Ich habe mich gewundert, wozu die Variable
Delphi-Quellcode:
slist: TStringList
ist, sie wird anscheinend nicht verwendet. Findet der Compiler überigens auch. Ich habe sie versuchsweise auskommentiert, und ohne scheint es genauso gut zu funktionieren.

Jedenfalls: Ganz großen Dank an Sven!
Von meiner Seite aus ist dieser Thread hiermit erledigt.
Andreas

JamesTKirk 27. Jan 2011 10:37

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von Phillie08 (Beitrag 1077500)
Nur noch eine Bemerkung: Ich habe mich gewundert, wozu die Variable
Delphi-Quellcode:
slist: TStringList
ist, sie wird anscheinend nicht verwendet. Findet der Compiler überigens auch. Ich habe sie versuchsweise auskommentiert, und ohne scheint es genauso gut zu funktionieren.

Upps, die Variable hatte ich vergessen (ich wollte es zuerst ohne
Delphi-Quellcode:
with
machen).

Gut zu wissen, dass es dir aber weitergeholfen hat. :)

Gruß,
Sven

Phillie08 30. Jan 2011 17:09

AW: Textdateien mit Umlauten im Inhalt
 
Zitat:

Zitat von JamesTKirk (Beitrag 1077005)

SysToUTF8/UTF8ToSys und AnsiToUTF8/UTF8ToAnsi sind in SysUtils oder gar System definiert (ich glaube allerdings System). Letztere musst du gar nicht einbinden (die ist immer verfügbar), die erstere ist meist eh schon eingebunden.

Die Funktionen in FileUtils sind UTF8 Wrapper um die Ansi Funktionen in SysUtils und Co.

Delphi-Quellcode:
begin
  with TStringList.Create do
    try
      LoadFromFile(DeinDateiName); // ein String
      DeinText := Text;
    finally
      Free;
    end;
end;
Alternativ kannst du statt
Delphi-Quellcode:
DeinText
auch gleich
Delphi-Quellcode:
Memo1.Lines.Text := SysToUTF8(Text)
verwenden.

Eigentlich hatte ich diesen Thread ja als erledigt angesehen. Aber da ich (meine eigene Blödheit!) gegen noch eine Mauer gerannt bin (und diese dann wenigstens selbst abtragen konnte), wollte ich doch folgende Ergänzung zum besten geben. Kann ja sein, dass irgendein anderes Opfer künftig ähnliche Probleme hat.

Das Einlesen in ein Memo fuktioniert wie oben beschrieben. Es existiert anscheinend eine Alternative, die ich nicht ausprobiert habe, weil folgende Bemerkungen in diesem Wiki
mich davon abgehalten hat:
Zitat:

Important: AnsiToUTF8 and UTF8ToAnsi require a widestring manager under Linux, BSD and Mac OS X. You can use the SysToUTF8 and UTF8ToSys functions (unit FileUtil) or add a the widetstring manager by adding cwstring as one of the first units to your program's uses section.
Zitat:

You can can convert between unicode and ansi using the UTF8ToAnsi and AnsiToUTF8 functions from the System unit or the UTF8ToSys and SysToUTF8 from the FileUtil unit. The later two are smarter but pull more code into your program.
Daraus ergibt sich, nebenbei, dass sysToUTF8 anscheinend doch in Unit FileUtil enthalten ist.

Jedenfalls wird man mit dem derart eingelesen Text vermutlich dies und das anstellen und anschließend zurückspeichern wollen. Und dazu verwendet man natürlich das Gegenstück UTF8ToSys:
Delphi-Quellcode:
with TStringList.Create do
    try
      Text := UTF8ToSys(Memo1.Lines.Text);
      SaveToFile(DateiName);
    finally
      Free;
    end;
Bitte um Nachsicht, wenn das allzu offensichtlich erscheint, ich musste erst drauf kommen.

Gruß, Andreas


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:02 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz