Einzelnen Beitrag anzeigen

Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#13

AW: Codierung (ANSI, UTF-8) einer Textdatei ermitteln

  Alt 7. Nov 2011, 17:33
Entschuldigt, hab ich irgendetwas nicht mitbekommen?
UTF-8 ist doch eine erweiterte Ansi-Codierung, es gibt also keine 16-Bit Characters, somit sollte eine Ansi-Text-Datei genauso lesbar sein wie eine UTF8-Text-Datei (oder andersherum).
Dann nimmt man sich die "Stop-Codes" xE0..x vor und schaut ob da etwas sinnvolles drin steckt.
Ggf. macht man einfach eine quantitative Analyse ob vllt. auffallend oft xE0 als Char auftaucht.

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat