Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Delphi HTML2TXT (https://www.delphipraxis.net/13141-html2txt.html)

Luckie 11. Dez 2003 17:48


HTML2TXT
 
Liste der Anhänge anzeigen (Anzahl: 1)
Also mein Problem. Ich habe HTML Dateien vorliegen, die ich in Text Dateien umwandeln muss. Nun, die Tags zu entfernen ist kein grosses Problem, nur läßt das Ergebnis etwas zu wünschen übrig. Es geht, sieht aber nicht schön aus. Der Ie bekommt das wesentlich besser hin: Datei -> Speichern unter -> Textdatei.

Hat da jemand schon was fertiges rumliegen und weiß nicht, was er damit anfangen soll oder kann mir einen Link geben? Ich habe schon diverse Sachen gefunden aund ausprobiert, bloß bei allen war das Ergebnis mehr als schlecht.

Bisher verwende ich diesen Code:
Delphi-Quellcode:
function striptags(value: string): string;
var
  i: integer;
  s: string;
begin
  i := 1;
  s := '';
  while i <= length(value) do
  begin
    if value[i] = '<' then
      repeat
        if bCancel then
          exit;
        inc(i);
        Application.ProcessMessages;
      until (value[i] = '>')
    else
      s := s + value[i];
    inc(i);
  end;
  result := s;
end;
Ich hange mal was an.

Luckie 11. Dez 2003 18:04

Re: HTML2TXT
 
Da ich realtiv faul bin, wäre meine Idee jetzt die Funktion, die der IE nutzt direkt zu nutzen. Wenn möglich ohne TWebbroser zu nutzen. Nur in welcher DLL steckt selbige und wie muss ich sie ansprechen? :shock:

Phoenix 11. Dez 2003 18:19

Re: HTML2TXT
 
Der IE interpretiert das HTML noch vor dem speichern.

Du müsstest z.B.
noch auswerten und durch einen Linebreak ersetzen. LI's müsstest Du einrücken etc..

Allein das sollte die Seite schon deutlich lesbarer machen.

Guck doch mal in den Sourcen von z.B. lynx (text-browser unter linux). Der macht das ja zur Laufzeit andauernd. Da lässt sicher einiges rauslesen.

Luckie 11. Dez 2003 19:06

Re: HTML2TXT
 
Ob vor oder nach dem Speichern ist ja egal.

Memo 11. Dez 2003 19:49

Re: HTML2TXT
 
Zitat:

Ich habe schon diverse Sachen gefunden aund ausprobiert, bloß bei allen war das Ergebnis mehr als schlecht
Da ich jetzt nicht weiß was du schon probiert hast, such doch mal nach Bei Google suchenhtmlparser delphi. Da sollte doch was bei sein.

Luckie 11. Dez 2003 19:51

Re: HTML2TXT
 
Auch schon gemacht. Auch "delphi html2txt" und diverse Kombinationen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 04:25 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz