Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Delphi umsteigen auf Berlin - Unicode (https://www.delphipraxis.net/190951-umsteigen-auf-berlin-unicode.html)

JanWe 22. Nov 2016 21:37

umsteigen auf Berlin - Unicode
 
hi,

ich hab mal versucht mich u.a. hier: http://www.delphipraxis.net/181351-unicode-strings.html einzulesen. Aber so richtig steig ich da nicht durch.
Ich hab bislang immer Delphi 6 und 7PE eingesetzt.
Jetzt hab ich aber ein paar lokal verarbeiteten HTML-Dateien, die offensichtlich - wie sich beim manuellen Versuch, sie zu parsen herausstellte - Unicodezeichen enthalten herausgestellt, dass die Verarbeitung mit meiner alten Delphi 7 PE einige Zeichen verschludert. (in den bearbeiteten HTML Dateien waren nachher einige besondere, im Browser problemlos darstellbare Zeichen durch andere ersetzt worden, was nicht mehr dem Fließ-Originaltext entspricht. Habe gerade keine Zeichen aus der HTML Datei greifbar. Aber man sieht einfach im Browser dann die Unterschiede, weil die wengien, besonderen Zeichen durch nichtssagende ersetzt wurden.)

So, nun kann ich kann ich aber meine unter Delphi 7 entwickelten PRogramme an der Uni von einem Kommilitonen als Delphi XDingens compilieren lassen.
(Ich selbst hab mir auch eine Lizenz von Berlin Starter gesichert. Komme aber wohl erst Ende Januar dazu, das zu installieren)

Was muss ich beachten, damit meine Dateien 1:1 Zeichenweise verarbeitet werden (z.B. sollen alle in der HTML vorkomemnden "$"-Zeichen durch "€" ersetzt werden)?

Wo kann ich mich da einlesen?
Was ist verständlich?
(Ich hab bisher immer nur einfache Programme geschrieben und für mich ist Unicode "#Neuland")

Danke Euch.

himitsu 22. Nov 2016 22:53

AW: umsteigen auf Berlin - Unicode
 
https://wiki.selfhtml.org/wiki/Refer...eichenreferenz

€ = € :zwinker:
Und wenn nicht, dann muß natürlich die Zeichenkodierung dieses Zeichens dem entsprechen, wie es im HTML-Header angegeben wurde.
PS: Früher arbeitete Vieles im Delphi mit ANSI und nun oftmals "standardmäßig" mit Unicode und bei Dateien UTF-8.


Und da du nicht verrätst, was du mit "zeichenweise" meinst, kann man da auch nicht viel zu sagen.

Aber, z.B. TStringList.LoadFromFile und SaveToFile haben nun noch einen weiteren Parameter, welcher dir eventuell helfen könnte.
Auch TStringStream und Co. haben irgendwo diese Möglichkeiten der Kodierung.

Und Grundsätzlich kann die Verwendung der "richtigen" Komponenten einem das Leben erleichtern.
Auf XML greift man mit einer XML-Komponente zu,
auf RTF mit einer RTF-Komponente
und für HTML gibt es ebenfalls Komponenten, welche dieses Datenformat "richtig" beherrschen.

jaenicke 23. Nov 2016 06:08

AW: umsteigen auf Berlin - Unicode
 
Umgekehrt gefragt:
Wie machst du es denn aktuell?

Normalerweise sollte das mit Delphi 2009 und höher einfach so gehen, wenn du normale Funktionalität wie TStringList usw. benutzt hast.

Auch mit Delphi 7 geht das aber problemlos über WideString, PWideChar usw., lediglich die VCL mit den visuellen Komponenten ist nicht unicodefähig.


Alle Zeitangaben in WEZ +1. Es ist jetzt 08:44 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz