AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Seiten durchsuchen

Ein Thema von mb1996 · begonnen am 3. Apr 2012 · letzter Beitrag vom 4. Apr 2012
Antwort Antwort
Seite 1 von 2  1 2      
mb1996

Registriert seit: 30. Dez 2009
243 Beiträge
 
Delphi 2009 Professional
 
#1

Seiten durchsuchen

  Alt 3. Apr 2012, 19:32
Hallo Leute,
ich möchte ein Programm programmieren, das eine HTML-Datei einer Website runterlädt und in der Datei nach Links suchen. Das Programm soll alle Links rausschreiben.

Wie bekomme ich das realiziert?
  Mit Zitat antworten Zitat
Perlsau
(Gast)

n/a Beiträge
 
#2

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 19:40
Hallo Leute, ich möchte ein Programm programmieren, das eine HTML-Datei einer Website runterlädt und in der Datei nach Links suchen. Das Programm soll alle Links rausschreiben. Wie bekomme ich das realiziert?
Indem du eine HTML-Datei herunterlädst und darin nach Links suchst. Mit anderen Worten:

Welche Art Antwort erwartest du jetzt? Gibt es bereits irgendwelche Ansätze, die du programmiert hast? Welchen Schwierigkeiten bist du dabei begegnet?

So könnte man dir helfen. Aber eine komplette Anwendung schreibt dir hier niemand.
  Mit Zitat antworten Zitat
Benutzerbild von Bummi
Bummi

Registriert seit: 15. Jun 2010
Ort: Augsburg Bayern Süddeutschland
3.470 Beiträge
 
Delphi XE3 Enterprise
 
#3

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 20:14
Wenn Du nicht selbst parsen möchtest
Delphi-Quellcode:
implementation
uses mshtml;
{$R *.dfm}
Procedure WebBrowserCreateStringListHREF(const AWebBrowser: TWebBrowser;sl:TStrings) ;
var
  nCount : Integer;
  elements : IHTMLElementCollection;
  element : IHTMLElement;
  sAnchor : String;
begin

  if Assigned(AWebBrowser.Document) then begin
    elements:= (AWebBrowser.Document as IHTMLDocument2).all;
    for nCount := 0 To Pred(elements.Length) do begin
      element := elements.item(nCount, '') as IHTMLElement;
      if element.tagName = 'Athen begin
         sAnchor := (element as IHTMLAnchorElement).href;
         sl.Add(sAnchor);
      end;
    end;
  end;

end;
procedure TForm2.FormCreate(Sender: TObject);
begin
  WebBrowser1.Navigate('www.google.de');
end;

procedure TForm2.WebBrowser1NavigateComplete2(ASender: TObject; const pDisp: IDispatch; var URL: OleVariant);

begin
   WebBrowserCreateStringListHREF(Webbrowser1,Listbox1.Items);
end;
Thomas Wassermann H₂♂
Das Problem steckt meistens zwischen den Ohren
DRY DRY KISS
H₂ (wenn bei meinen Snipplets nichts anderes angegeben ist Lizenz: WTFPL)
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#4

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 20:35
Mit Indy runterladen (HTTP.Get) und mit pos/posex nach href suchen und mit Copy rauskopieren.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#5

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:07
Mit Indy runterladen (HTTP.Get) und mit pos/posex nach href suchen und mit Copy rauskopieren.
Ein Hier im Forum suchenXML-Parser macht das Leben einfacher (der kann auch HTML Seiten zerlegen )
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
mb1996

Registriert seit: 30. Dez 2009
243 Beiträge
 
Delphi 2009 Professional
 
#6

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:20
Danke Leute,
ihr habt mir SEHR geholfen
Ganz besonders BUMMI

Nur eine Sache zu Bummi. Bei mir läuft das mit NavigateComplete nicht. Deswegen habe ich es an einem Button getestet.
  Mit Zitat antworten Zitat
Perlsau
(Gast)

n/a Beiträge
 
#7

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:23
Bei mir läuft das mit NavigateComplete nicht. Deswegen habe ich es an einem Button getestet.
Das ist der Nachteil, wenn man fertige Methoden einfach kopiert: Man begreift dabei gewöhnlich nichts.
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#8

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:28
Danke Leute,
ihr habt mir SEHR geholfen
Ganz besonders BUMMI

Nur eine Sache zu Bummi. Bei mir läuft das mit NavigateComplete nicht. Deswegen habe ich es an einem Button getestet.
mit

Hast du das Event auch an die TWebbrowser Komponente Webbrowser1.OnNavigateComplete2 im OI gebunden?

Und um nur die Links zu bekommen ist ein TWebbrowser schon eine Bremse, denn der lädt ja (ist ja auch ein Browser) alle Bilder etc. herunter und rendert diese auch noch.

Mit TIdHTTP wird nur die reine HTML-Datei geladen, wo aber alle Links enthalten sind.
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
Benutzerbild von Bummi
Bummi

Registriert seit: 15. Jun 2010
Ort: Augsburg Bayern Süddeutschland
3.470 Beiträge
 
Delphi XE3 Enterprise
 
#9

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:30
je nach dem was Du vor hast solltest Du Dir ein passendes Ereignis suchen, ein weiterer Kandidat wäre OnDocumentComplete ... das ist der Nachteil der asynchronen Methoden
Thomas Wassermann H₂♂
Das Problem steckt meistens zwischen den Ohren
DRY DRY KISS
H₂ (wenn bei meinen Snipplets nichts anderes angegeben ist Lizenz: WTFPL)
  Mit Zitat antworten Zitat
mb1996

Registriert seit: 30. Dez 2009
243 Beiträge
 
Delphi 2009 Professional
 
#10

AW: Seiten durchsuchen

  Alt 3. Apr 2012, 22:39
Ich habe das nicht einfach kopiert!!!!
Es funktioniert wirklich nicht (mit dem Ereignis). Da werde ich mir morgen einfach ein anderes suchen.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:05 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz