![]() |
HTML2TXT
Liste der Anhänge anzeigen (Anzahl: 1)
Also mein Problem. Ich habe HTML Dateien vorliegen, die ich in Text Dateien umwandeln muss. Nun, die Tags zu entfernen ist kein grosses Problem, nur läßt das Ergebnis etwas zu wünschen übrig. Es geht, sieht aber nicht schön aus. Der Ie bekommt das wesentlich besser hin: Datei -> Speichern unter -> Textdatei.
Hat da jemand schon was fertiges rumliegen und weiß nicht, was er damit anfangen soll oder kann mir einen Link geben? Ich habe schon diverse Sachen gefunden aund ausprobiert, bloß bei allen war das Ergebnis mehr als schlecht. Bisher verwende ich diesen Code:
Delphi-Quellcode:
Ich hange mal was an.
function striptags(value: string): string;
var i: integer; s: string; begin i := 1; s := ''; while i <= length(value) do begin if value[i] = '<' then repeat if bCancel then exit; inc(i); Application.ProcessMessages; until (value[i] = '>') else s := s + value[i]; inc(i); end; result := s; end; |
Re: HTML2TXT
Da ich realtiv faul bin, wäre meine Idee jetzt die Funktion, die der IE nutzt direkt zu nutzen. Wenn möglich ohne TWebbroser zu nutzen. Nur in welcher DLL steckt selbige und wie muss ich sie ansprechen? :shock:
|
Re: HTML2TXT
Der IE interpretiert das HTML noch vor dem speichern.
Du müsstest z.B. noch auswerten und durch einen Linebreak ersetzen. LI's müsstest Du einrücken etc.. Allein das sollte die Seite schon deutlich lesbarer machen. Guck doch mal in den Sourcen von z.B. lynx (text-browser unter linux). Der macht das ja zur Laufzeit andauernd. Da lässt sicher einiges rauslesen. |
Re: HTML2TXT
Ob vor oder nach dem Speichern ist ja egal.
|
Re: HTML2TXT
Zitat:
![]() |
Re: HTML2TXT
Auch schon gemacht. Auch "delphi html2txt" und diverse Kombinationen.
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 04:25 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz