Einzelnen Beitrag anzeigen

delnu
(Gast)

n/a Beiträge
 
#17

AW: .html Datei zeilenweise lesen

  Alt 4. Jan 2013, 20:56
Wie angekündigt, habe ich mal meine früheren Tests rausgesucht.

Die ZIP-Datei "UTF_TEST.ZIP" enthält einige Testansätze vom Dezember 2009/Januar 2010 zum Auslesen bzw. Konvertieren von Dateien unterschiedlicher Textformate. Benutzt wurden Delphi 5 und die damals aktuelle Lazarus-Version. Ich habe das nicht weiter entwickelt und man möge mir eventuelle Ungereimtheiten nachsehen. Die enthaltenen Quelltexte sind nur im Hinblick auf die wesentlichen Problemstellungen kommentiert. Es werden lediglich Standardkomponenten benutzt. Es ist nicht auszuschliessen, daß die Quelltexte je nach benutzter Compilerversion angepaßt werden müssen. Die ZIP-Datei enthält ausser den vollständigen Quelltexten die EXE-Dateien der beiden Delphi-Programme. Weil Lazarus unheimlich aufbläht und darum nach wie vor eine unzumutbare Notlösung statt eines wirklich brauchbares Programm darzustellen, habe ich die ca. 12 MB große EXE-Datei des Lazarus-Beispiels entfernt.

Einzige aktuelle Änderung : Soweit in einigen Dateien mein Name und meine Anschrift enthalten waren, habe ich diese Angaben entfernt.

Die wesentlichsten in der ZIP-Datei enthaltene Dateien :
TABELLE.TXT : unvollständige Tabellenübersicht von HTML- und Unicode- Ersatzzeichen

Verzeichnis "D_TEST" : Analyse- und Konvertierungsprogramm
Beschreibung.rtf : Kurzbeschreibung der Programmfunktion
ConvTable.pas : Die ausgelagerte Konvertierungs-Unit

Verzeichnis "DELPHI" :
Optischer Vergleich verschiedener Codierungen/Konvertierungen anhand bekannter bzw. gebräuchlicher Sonderzeichen und Umlaute.
CHARSET.TXT : unkontrollierte Vergleichstabelle zu Testzwecken
UChars.pas : Die ausgelagerte UNVOLLSTÄNDIGE Vergleichstabelle ( ASCII, ANSI, UTF-8 )
UTxtConv.pas : Die ausgelagerte Konvertierungs-Unit

Verzeichnis "LAZARUS" :
Weil mich Lazarus nicht mehr sonderlich interessiert, kann ich über diesen Test nicht mehr allzuviel äussern, außer daß damit die Datei "TABELLE.INC" erzeugt werden kann.
TABELLE.INC : Durch das Programm erzeugte Include-Datei mit UTF-Tabelle der Zeichen 128 bis 255
TABELLE_1.TXT : ASCII-Zeichensatz mit Unicode-Angaben ?
TABELLE_2.TXT : ANSI-Zeichensatz mit Unicode-Angaben ?

Leider sind alle neueren/aktuellen Versionen des von mir benutzten Texteditors Notepad++ nicht mehr in der Lage, ASCII-Zeichen darzustellen, so daß ich diesbzgl. nichts mehr kontrollieren kann.
Angehängte Dateien
Dateityp: zip UTF_TEST.ZIP (587,1 KB, 2x aufgerufen)
  Mit Zitat antworten Zitat