AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Infos von Webseiten abrufen
Thema durchsuchen
Ansicht
Themen-Optionen

Infos von Webseiten abrufen

Ein Thema von robinWie · begonnen am 28. Mai 2006 · letzter Beitrag vom 30. Mai 2006
Antwort Antwort
Seite 2 von 2     12   
Benutzerbild von robinWie
robinWie

Registriert seit: 26. Okt 2005
Ort: Lippcity
404 Beiträge
 
Delphi 2005 Personal
 
#11

Re: Infos von Webseiten abrufen

  Alt 29. Mai 2006, 17:58
Habs jetz folgendermaßen hinbekommen. Ich lasse mir die runtergeladene HTML einfach zum Text konvertieren.

Anhand des Beispiel-Links aus meinem 1. Beitrag
Delphi-Quellcode:
unit Unit2;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, URLMon, StdCtrls;

type
  TForm2 = class(TForm)
    Button1: TButton;
    Memo1: TMemo;
    procedure Button1Click(Sender: TObject);
  private
    { Private-Deklarationen }
  public
    { Public-Deklarationen }
  end;

var
  Form2: TForm2;

implementation

{$R *.dfm}

procedure HTML2Text(InFile, OutFile : String);
var s, t: TextFile;
  si: File;
  uml: String;
  param: char;
  i, j: integer;
  IsTag, Umlaut: Boolean;
  ASCII: Integer;
  Titel: String;
begin
  AssignFile(s,InFile);
  AssignFile(t,OutFile);
  Reset(s);
  Rewrite(t);
  IsTag := False;

  while not Eof(s) do
  begin
    Umlaut := False;
    j := 0;
    read(s, param);

    if (param = '<') or (param = '{') then
    begin
      IsTag := true;
      write(t, ' ');
    end;

    // Wenn & gefunden, dann überprüfen ob Sonderzeichen vorliegt.
   if not IsTag and (Param = '&') then
    begin
      uml := param;
      j := 0;
      Umlaut := true;
    // Maximal 8 Zeichen lesen oder bis ; gefunden
    repeat
      read(s, param);
      inc (j);
      uml := uml + param;
    until (j = 8) or (param = ';');

    if (param = ';') then
    begin
   // param := GiveSZ (uml);
      write(t,param);
    end
    else write(t,uml);
    Umlaut := false;
   end;
   if not IsTag and not Umlaut then write(t, param);
   if (param = '>') or (param = '}') then IsTag := false;
  end;

  CloseFile(s);
  CloseFile(t);
end;

procedure TForm2.Button1Click(Sender: TObject);
var
  Datei,Ziel:PChar;
begin
  Form2.Caption := 'Download gestartet';
  try
    Datei := 'http://www.drumheads.de/playlists/Refardeon.html';
    Ziel := 'D:\text.html';
    UrlDownloadToFile(nil, Datei, Ziel, 0, nil);
    Form2.Caption := 'Download beendet';
  except
    showmessage('Download abgebrochen');
    EXIT;
  end;

  HTML2TEXT('D:\text.html','D:\cnv_text.txt');
  Memo1.Lines.LoadFromFile('D:\cnv_text.txt');
  DeleteFile('D:\text.html');
  DeleteFile('D:\cnv_text.txt');
end;

end.
[edit] Link rausgenommen. Fehler [/edit]
Robin W.
Ein Computer kann (fast) alles.... Man muss es ihm nur beibringen
  Mit Zitat antworten Zitat
Benutzerbild von inherited
inherited

Registriert seit: 19. Dez 2005
Ort: Rosdorf
2.022 Beiträge
 
Turbo Delphi für Win32
 
#12

Re: Infos von Webseiten abrufen

  Alt 29. Mai 2006, 18:26
Wie wäre es wenn du noch mit anzeigen läst, WARUM der download mög. abgebrohen wurde
Nikolai Wyderka

SWIM SWIM HUNGRY!
Neuer Blog: hier!
  Mit Zitat antworten Zitat
Benutzerbild von robinWie
robinWie

Registriert seit: 26. Okt 2005
Ort: Lippcity
404 Beiträge
 
Delphi 2005 Personal
 
#13

Re: Infos von Webseiten abrufen

  Alt 30. Mai 2006, 16:08
Zitat:
Wie wäre es wenn du noch mit anzeigen läst, WARUM der download mög. abgebrohen wurde
Das kann ja noch kommen. Wichtig ist nur das es erstmal funzt

[edit]Das einfachste wäre ja, den Server anzupingen und bei keiner Antwort zu sagen "Verbindung unterbrochen". [/edit]
___________
Verdammt. Wenn ich jetz keine PL runterlade sonder eine "normale" Seite habe ich nur den Code aber nicht was da gerade steht *drop*
Robin W.
Ein Computer kann (fast) alles.... Man muss es ihm nur beibringen
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:57 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz