AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

HTML2TXT

Ein Thema von Luckie · begonnen am 11. Dez 2003 · letzter Beitrag vom 11. Dez 2003
Antwort Antwort
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#1

HTML2TXT

  Alt 11. Dez 2003, 17:48
Also mein Problem. Ich habe HTML Dateien vorliegen, die ich in Text Dateien umwandeln muss. Nun, die Tags zu entfernen ist kein grosses Problem, nur läßt das Ergebnis etwas zu wünschen übrig. Es geht, sieht aber nicht schön aus. Der Ie bekommt das wesentlich besser hin: Datei -> Speichern unter -> Textdatei.

Hat da jemand schon was fertiges rumliegen und weiß nicht, was er damit anfangen soll oder kann mir einen Link geben? Ich habe schon diverse Sachen gefunden aund ausprobiert, bloß bei allen war das Ergebnis mehr als schlecht.

Bisher verwende ich diesen Code:
Delphi-Quellcode:
function striptags(value: string): string;
var
  i: integer;
  s: string;
begin
  i := 1;
  s := '';
  while i <= length(value) do
  begin
    if value[i] = '<then
      repeat
        if bCancel then
          exit;
        inc(i);
        Application.ProcessMessages;
      until (value[i] = '>')
    else
      s := s + value[i];
    inc(i);
  end;
  result := s;
end;
Ich hange mal was an.
Angehängte Dateien
Dateityp: zip beispiel_207.zip (55,6 KB, 8x aufgerufen)
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#2

Re: HTML2TXT

  Alt 11. Dez 2003, 18:04
Da ich realtiv faul bin, wäre meine Idee jetzt die Funktion, die der IE nutzt direkt zu nutzen. Wenn möglich ohne TWebbroser zu nutzen. Nur in welcher DLL steckt selbige und wie muss ich sie ansprechen?
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Phoenix
Phoenix
(Moderator)

Registriert seit: 25. Jun 2002
Ort: Hausach
7.611 Beiträge
 
#3

Re: HTML2TXT

  Alt 11. Dez 2003, 18:19
Der IE interpretiert das HTML noch vor dem speichern.

Du müsstest z.B.
noch auswerten und durch einen Linebreak ersetzen. LI's müsstest Du einrücken etc..

Allein das sollte die Seite schon deutlich lesbarer machen.

Guck doch mal in den Sourcen von z.B. lynx (text-browser unter linux). Der macht das ja zur Laufzeit andauernd. Da lässt sicher einiges rauslesen.
Sebastian Gingter
Phoenix - 不死鳥, Microsoft MVP, Rettungshundeführer
Über mich: Sebastian Gingter @ Thinktecture Mein Blog: https://gingter.org
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#4

Re: HTML2TXT

  Alt 11. Dez 2003, 19:06
Ob vor oder nach dem Speichern ist ja egal.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Memo
Memo

Registriert seit: 19. Aug 2003
509 Beiträge
 
Delphi 7 Enterprise
 
#5

Re: HTML2TXT

  Alt 11. Dez 2003, 19:49
Zitat:
Ich habe schon diverse Sachen gefunden aund ausprobiert, bloß bei allen war das Ergebnis mehr als schlecht
Da ich jetzt nicht weiß was du schon probiert hast, such doch mal nach Bei Google suchenhtmlparser delphi. Da sollte doch was bei sein.
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#6

Re: HTML2TXT

  Alt 11. Dez 2003, 19:51
Auch schon gemacht. Auch "delphi html2txt" und diverse Kombinationen.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:45 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz