AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

.html Datei zeilenweise lesen

Ein Thema von af99 · begonnen am 2. Jan 2013 · letzter Beitrag vom 4. Jan 2013
Antwort Antwort
Benutzerbild von Mavarik
Mavarik

Registriert seit: 9. Feb 2006
Ort: Stolberg (Rhld)
4.164 Beiträge
 
Delphi 10.3 Rio
 
#1

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 15:15
http://de.wikipedia.org/wiki/Byte_Order_Mark
Code:
Kodierung     hexadezimale Darstellung  dezimale Darstellung  Darstellung nach Windows-1252
UTF-16 (LE)   FF FE                     255 254               ÿþ
UTF8-UTF16 na war doch schon fast richtig meine Idee.

Obwohl das nicht zur Codierung im Beispiel passt...
  Mit Zitat antworten Zitat
Morphie

Registriert seit: 27. Apr 2008
Ort: Rahden
630 Beiträge
 
#2

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 15:32
Obwohl das nicht zur Codierung im Beispiel passt...
Wobei man sich dabei offenbar gar nicht sicher ist... Offiziell darf man gar kein Charset bei UTF-16 angeben
Zitat von http://www.w3.org/International/questions/qa-html-encoding-declarations.de.php#utf16:
In diesem Artikel wird allgemein empfohlen, die Zeichencodierung innerhalb des Dokuments anzugeben, selbst wenn sie auch im HTTP-Header angegeben ist. Die HTML5-Spezifikation verbietet allerdings gegenwärtig die Verwendung des meta-charset-Attributs oder der Pragma-Direktive zur Angabe von UTF-16. Es ist eine Diskussion im Gang, ob das so sein muss; das kann sich noch ändern. Gegenwärtig sollte man, wenn valider HTML5-Code gewünscht ist, diese Angaben nicht für UTF-16-codierte Inhalte verwenden.

Ob Sie Element-basierte Angaben verwenden oder nicht, Sie sollten sicherstellen, dass Sie immer ein BOM (byte-order mark) ganz am Anfang einer UTF-16-codierten Datei zu stehen haben. Im Effekt ist dies die Angabe innerhalb des Dokuments.
  Mit Zitat antworten Zitat
Popov
(Gast)

n/a Beiträge
 
#3

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 15:35
Aus dem Artikel von Wiki:

Zitat:
Da das Zeichen U+FFFE als ungültig definiert ist
Woraus ich verstehe, dass die beiden Zeichen sowieso dazu gedacht sind allgemein ignoriert zu werden, speziell dazu gedacht sind anzuzeigen welche Kodierung es ist. Wenn du sie also löscht, wie du es gemacht hast, dann machst du anscheinend erst ein mal das Richtige. Allerdings solltest man nicht ignorieren, dass es eine UTF-16 Datei ist.
  Mit Zitat antworten Zitat
af99

Registriert seit: 22. Apr 2004
84 Beiträge
 
Delphi XE5 Ultimate
 
#4

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 15:40
ich habe die Zeichen nur zum Test gelöscht. Wenn das Programm mal läuft dann kann ich die Zeichen nicht löschen. Ich muss also mit der Datei so auskommen wie sie ist. Gibt es denn keine Funktion zum Umwandeln ???
  Mit Zitat antworten Zitat
Popov
(Gast)

n/a Beiträge
 
#5

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 16:07
ich habe die Zeichen nur zum Test gelöscht. Wenn das Programm mal läuft dann kann ich die Zeichen nicht löschen. Ich muss also mit der Datei so auskommen wie sie ist. Gibt es denn keine Funktion zum Umwandeln ???
Ich meinte nicht, dass du sie gleich löschen sollst, aber du kannst sie ignorieren. Was das konvertieren angeht, so dürfte das erst einmal kein Problem sein. Die Frage ist eher, ob das Ok ist. Was bringt es die Datei in 8 Bit zu konvertieren und Informationen gehen verloren. Und auch sonst, wo ist das Problem die Datei als Temp-Datei zu speichern und sie nach eigenen Bedürfnissen zu bearbeiten? Alternativ FileStream.

Schon mal was von TFileStream gehört? Die Datei laden und da bearbeiten. Für mich einfacher als das andere.

Übrigens, im umwandeln kenne ich mich weniger aus, aber wie wäre es mit AnsiToUtf8?
  Mit Zitat antworten Zitat
Alt 2. Jan 2013, 16:24     Erstellt von dunningkruger
Dieser Beitrag wurde von Daniel gelöscht. - Grund: Unsachliche Beiträge entfernt.
Alt 2. Jan 2013, 16:41     Erstellt von Popov
Dieser Beitrag wurde von Daniel gelöscht. - Grund: Unsachliche Beiträge entfernt.
delnu
(Gast)

n/a Beiträge
 
#8

AW: .html Datei zeilenweise lesen

  Alt 2. Jan 2013, 23:18
Zur Umwandlung der gesamten Datei z.B. ins Ansi-Format eignet sich der Editor "Notepad++" !

Datei laden, unter dem Menüpunkt "Kodierung" sicherheitshalber prüfen, in welchem Format die Datei gespeichert ist und dann ( selber Menüpunkt ) ins Zielformat umwandeln, z.B. durch "Konvertiere zu ANSI".

Das Einlesen/Umsetzen von Unicode ist ( eingeschränkt ) auch mit alten Delphi-Versionen möglich, wenn man entsprechende Code-Tabellen in den Quelltext einfügt, die dann die jeweiligen Zeichen gegeneinander austauschen. Das funktioniert aber nur soweit es sich um Standardzeichen handelt.
Bei Gelegenheit werde ich hier mal meine Tabellen posten, muß sie aber erst raussuchen.

Geändert von delnu ( 2. Jan 2013 um 23:28 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:47 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz