AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Wie kann man TEncoding vergleichen?

Ein Thema von Codehunter · begonnen am 29. Aug 2017 · letzter Beitrag vom 30. Aug 2017
Antwort Antwort
Benutzerbild von Codehunter
Codehunter

Registriert seit: 3. Jun 2003
Ort: Thüringen
2.291 Beiträge
 
Delphi 12 Athens
 
#1

AW: Wie kann man TEncoding vergleichen?

  Alt 30. Aug 2017, 07:47
Dann nimm doch TEncoding.ANSI!
Das ist ja ein Ding! Ich bin gar nicht auf die Idee gekommen, ANSI überhaupt zu testen wenn 7-Bit-ASCII schon nicht geht.

Kurz erklärt warum ich hier Probleme habe: Ich lese eine INI-Datei die als UTF8 ohne BOM gespeichert ist, mit TIniFile ein. Da dieses über die API-Funktionen nur ANSI einliest, wandle ich alles mit DecodeUTF8 um. Anschließend sollen die gelesenen Werte in einer konfigurierbaren (!!!) Kodierung wieder geschrieben werden, in eine andere Datei.

Also lese ich da nun den Teststring "äöüßÄÖÜ" aus meiner Quell-INI ein, wandle mit DecodeUTF8 um, baue in einer TStringList die neue Datei zusammen und speichere die dann mit TStringList.SaveToFile('Dateiname.txt', TEncoding.ANSI {.ASCII, .UTF8 oder .Unicode, je nach Benutzereinstellung}) . Der Teststring "äöüßÄÖÜ" liegt nach dem Einlesen tatsächlich noch korrekt als WideString im Speicher. Die fehlerhafte Umkodierung passiert dann beim Speichern aus TStringList:
Code:
Input-UTF8:    äöüßÄÖÜ
Widestring:    äöüßÄÖÜ
Output-ANSI:   äöüßÄÖÜ
Output-ASCII:  aou?AOU
Output-UTF7:   +AOQA9gD8AN8AxADWANw-
Output-UTF8:   äöüßÄÖÜ
Output-Unicode: äöüßÄÖÜ
Hinterher ausgelesen dann jeweils mit Notepad++. Für was ist das ASCII-Encoding dann eigentlich nütze?
Ich mache grundsätzlich keine Screenshots. Schießen auf Bildschirme gibt nämlich hässliche Pixelfehler und schadet der Gesundheit vom Kollegen gegenüber. I und E zu vertauschen hätte den selben negativen Effekt, würde aber eher dem Betriebsklima schaden
  Mit Zitat antworten Zitat
Benutzerbild von Uwe Raabe
Uwe Raabe

Registriert seit: 20. Jan 2006
Ort: Lübbecke
11.750 Beiträge
 
Delphi 12 Athens
 
#2

AW: Wie kann man TEncoding vergleichen?

  Alt 30. Aug 2017, 07:52
Kurz erklärt warum ich hier Probleme habe: Ich lese eine INI-Datei die als UTF8 ohne BOM gespeichert ist, mit TIniFile ein. Da dieses über die API-Funktionen nur ANSI einliest, wandle ich alles mit DecodeUTF8 um. Anschließend sollen die gelesenen Werte in einer konfigurierbaren (!!!) Kodierung wieder geschrieben werden, in eine andere Datei.
Warum dann nicht gleich so?
myIniFile := TMemIniFile(AFileName, TEncoding.UTF8); // kommt auch mit Dateien ohne BOM zurecht
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#3

AW: Wie kann man TEncoding vergleichen?

  Alt 30. Aug 2017, 08:55
Der ASCII-Output ist zumindest seltsam.
Wenn es US-ASCII ist dann sollten da nur Ersatzeichen auftauchen. Handelt es sich um DIN-ASCII (ja hat es gegeben) dann sollten die Umlaute zu eckiger und geschweifter Klammer werden, wobei die Frage ist, welche Kodierung versteht eigentlich die darstellende Software?
Wenn Du die originäre (numerische) Codierung eines Zeichen nicht kennst, ist die Buchstabendarstellung Vertrauenssache.

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Benutzerbild von Codehunter
Codehunter

Registriert seit: 3. Jun 2003
Ort: Thüringen
2.291 Beiträge
 
Delphi 12 Athens
 
#4

AW: Wie kann man TEncoding vergleichen?

  Alt 30. Aug 2017, 09:18
Warum dann nicht gleich so?
myIniFile := TMemIniFile(AFileName, TEncoding.UTF8); // kommt auch mit Dateien ohne BOM zurecht
Noch nie verwendet. Schau ich mir mal an.
Der ASCII-Output ist zumindest seltsam.
Wenn es US-ASCII ist dann sollten da nur Ersatzeichen auftauchen. Handelt es sich um DIN-ASCII (ja hat es gegeben) dann sollten die Umlaute zu eckiger und geschweifter Klammer werden
Genau das habe ich mir auch gedacht! Denn ich kenne das so bei vermurkster Umkodierung, dass da entweder Rechtecke oder Fragezeichen auftauchen.
wobei die Frage ist, welche Kodierung versteht eigentlich die darstellende Software?
Zu Testzwecken verwende ich Notepad++ und HexEditor MX. NP++ kann abgesehen von UTF7 alle Kodierungen. Worauf die Anwendung dann beim Nutzer treffen wird weiß ich noch nicht. Deshalb ja auch der ganze Aufwand mit der Umkodierung.
Ich mache grundsätzlich keine Screenshots. Schießen auf Bildschirme gibt nämlich hässliche Pixelfehler und schadet der Gesundheit vom Kollegen gegenüber. I und E zu vertauschen hätte den selben negativen Effekt, würde aber eher dem Betriebsklima schaden
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:05 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz