![]() |
Website durchsuchen
HI leute,
ich hab mal schon wieder eine Frage. Gibt es eine Möglichkeit eine Website (mit z.b. Indy) nach bestimmten dateien zu durchsuchen? z.b. nach *.txt dokumenten oder *.html dokumenten |
Re: Website durchsuchen
Hallo,
nun, indy durchscuth nicht die html Dateien. Mit idhttp kannst zu z.B. das html Document in eine Stringlist oder einen Stream laden. Die StringList oder den Stream mußt Du dann selber nach dem was Du finden willst durchsuchen. Grüße Klaus |
Re: Website durchsuchen
@klaus1 Ich möchte eigentlich nicht das html dokument durchsuchen sondern die komplette website auf dateien, die man auf der SEite runterladen kann!
aber oK |
Re: Website durchsuchen
Zitat:
Eine Webseite besteht aus verlinkten html Seiten. Eine Webseite wie Du sie siehst wird im Webbrowser visualisiert Grundlage ist das html Document. Grüße Klaus |
Re: Website durchsuchen
Imprinzip schon! Wenn du suchen würdest würdest du das Html dokument auf z.b. datei.txt durchsuchen und da wo es vorkommt den pfad extrahieren und downloaden. Habe ich das richtig interpretiert?
|
Re: Website durchsuchen
Zitat:
Grüße Klaus |
Re: Website durchsuchen
Hallo,
Kernstück eines WebSpiders ist eine Funktion, welche die auf einer HTML-Seite vorhandenen Links ermittelt und dann die entsprechenden Seiten rekursiv aufsucht: ![]() Vorsicht vor Endlosschleifen. Und da alle Seiten einer web site einen nicht zyklusfreien Graph beliebigen Grades darstellen, sollte man auch eine maximale Rekursionstiefe festlegen. Grüße vom marabu |
Re: Website durchsuchen
So nebenbei, Klaus01 er hat nach einer Website gefragt und nicht nach einer Webseite. Aber ich glaube nicht, dass es die Möglichkeit gibt das Verzeichnis zu durchsuchen, auch nicht mit php, da es ja nicht auf dem eigenen Server liegt.
|
Re: Website durchsuchen
Hallo Dominik,
Zitat:
Freundliche Grüße |
Re: Website durchsuchen
hi marabu,
funzt sowas mit der indy nicht? Oder wie verwendest du diese funktion
Delphi-Quellcode:
procedure ExtractLinks(doc: IHTMLDocument2; s: TStrings);
var ec: IHTMLElementCollection; e: IHTMLElement; i: integer; url: Variant; begin ec := doc.links; for i := 0 to Pred(ec.length) do begin e := ec.item(i, 0) as IHTMLElement; url := VarToStr(e.getAttribute('href', 0)); if url <> '' then s.Add(url); end; end; |
Alle Zeitangaben in WEZ +1. Es ist jetzt 09:36 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz