Einzelnen Beitrag anzeigen

peterbelow

Registriert seit: 12. Jan 2019
Ort: Hessen
672 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Unsichtbare UTF16 Zeichen

  Alt 11. Jun 2023, 10:54
konvertriere den UTF-8 Text nach UTF-16, wirf dort die unerwünschten Zeichen raus und konvertiere das Resultat zurück nach UTF-8.

Wie im Detail hängt von der verwendeten Delphi-Version ab und in welchem Datentyp der UTF-8-String gespeichert ist. Neuere Delphiversionen haben z. B. einen Utf8String Typ. Durch simple Zuweisung an eine Variable vom Typ String erfolgt die Konvertierung in UTF-16 und der umgekehrte Weg funktioniert genauso.
Die Unit System.Character enthält eine Menge Funktionen zur Klassifizierung von UTF-16 Zeichen, z. B. IsWhitespace; damit kann man die unerwünschten Zeichen identifizieren. Die meisten dieser Funktionen sind auch über TCharHelper verfügbar, man also direkt sowas wie aString[i].IsWhitespace verwenden.
Peter Below
  Mit Zitat antworten Zitat