Einzelnen Beitrag anzeigen

Benutzerbild von Uwe Raabe
Uwe Raabe

Registriert seit: 20. Jan 2006
Ort: Lübbecke
6.824 Beiträge
 
Delphi 10.3 Rio
 
#13

AW: Kaputte Datei ohne Encoding mit Umlauten in StringList laden+Zeichen erhalten

  Alt 15. Apr 2019, 15:23
Du könntest die Überprüfung noch etwas verfeinern, in dem du auf eine gültige UTF-8 Kodierung prüfst:
  1. Ist das höchste Bit 0, ist es ein ASCII-Zeichen (entspricht deinem Test)
  2. Sind die höchsten drei Bit eine 110, dann kommt als nächstes ein Folgebyte
  3. Sind die höchsten vier Bit eine 1110, dann kommen als nächstes zwei Folgebyte
  4. Sind die höchsten fünf Bit eine 11110, dann kommen als nächstes drei Folgebyte
  5. Ein Folgebyte hat als höchste zwei Bit eine 10
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat