Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
15. Apr 2019
Bei meinen Tests bin ich von 1 bis 4 Byte pro Zeichen gekommen und UTF-8 ging immer gut.
Ich versuche nur das Schlimmste zu vermeiden. Aber wenn jemand in den Daten rumspielt und sie absichtlich verändert kann ich auch nix mehr machen :gruebel:
Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
15. Apr 2019
Habe ich eben reingeschrieben.
Ich erhalte jetzt TEncoding.Default immer dann zurück, wenn alle Versuche UTF-8 zu erkennen schief gehen und nichts vorhanden ist.
UTF-8 mit und ohne BOM erkennen ist ja relativ einfach. Aber solche Western Dateien die fallen durch alle Raster und ganz am Ende der Prüfkette muss man dann eben auf Default ausweichen.
Eine andere Lösung für das Problem ist, dass...
Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
15. Apr 2019
Genau und wenn ich die Datei mit UTF8 Encoding laden möchte knallt es. Deswegen try-except und im except dann TEncoding.Default.
Erst gucke ich ob ein BOM vorhanden ist. Wenn nicht prüfe ich jedes Zeichen der Datei (Stream) ob es über #127 hinaus geht. Wenn ja, sind zumindest Zeichen außerhalb der 8 bit vorhanden.
Dann versuche ich mit UTF8 Encoding die Datei zu laden was auch bei...
Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
15. Apr 2019
Das ist eine Datei mit freiem, zuzfälligem Testinhalt.
Egal was drin stünde, die Daten wären verloren zwecks fehlendem Encoding. Das ist mir jetzt klar.
3F, Fragezeichen. Da wäre im schlimmsten Fall nix zu retten.
Gilt hier als Notlösung so eine Datei einfach mit TEncoding.Default zu laden?
Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
15. Apr 2019
Leider weiß ich nicht wie diese Datei erzeugt wurde.
Ich habe nur noch ein seltenes Exemplar davon auf meinem Computer.
Das ist von Sublime. Ich glaube nicht, dass das Unicodezeichen überhaupt noch in der Datei existiert. Das Encoding fehlt schließlich.
Soll ich die Datei mal hier hochladen? Sie ist 5 Bytes groß (3 Zeichen, 2 Leerstellen), offensichtlich kein Multibyte.
Forum: Algorithmen, Datenstrukturen und Klassendesign
by DieDolly,
14. Apr 2019
Spoiler: die Daten wären verloren :lol:
Ich komme bei einem Problem nicht weiter. Ich lade mit TFile und TEncoding.UTF8 eine Datei in eine StringList. Ich möchte es jedenfalls.
Aber meine Datei scheint kaputt zu sein.
Die Datei ist laut Notepad++ ohne Encoding. Laut Sublime Western (Windows 1252).
Die Datei hat vor dem Speichern den Inhalt und hat laut Notepad++ wie gesagt danach kein...