Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Komplette Webseite speichern (https://www.delphipraxis.net/168124-komplette-webseite-speichern.html)

eddie11 6. Mai 2012 16:16

Komplette Webseite speichern
 
Hallo Gemeinde,

ich möchte eine komplette Webseite incl. der Links (weitere Seiten) speichern um die darin enthaltenen Informationen weiter zu verarbeiten. Konkret möchte ich die Konfigurationsseiten eines (oder mehrerer) Druckers im lokalen Netz auslesen. Und zwar nicht nur die Hauptseite sondern auch alle Folgeseiten.

Beispiel: ein Drucker hat die IP 192.168.1.100. Wenn ich dies Adress im Browser aufrufe, dann wird eine Startseite angezeigt. Auf dieser Startseite befinden sich mehrere Links

http://192.168.1.100/info_suppliesSt...u=SupplyStatus
http://192.168.1.100/info_configurat...menu=DevConfig
u.s.w.

Ich möchte nun wie schon gesagt von allen Seiten die vorne "http://192.168.1.100" haben abspeichern.

Ich kann natürlich die erste Seite auslesen und speichern, dann nach "href" suchen und öffnen u.s.w. Gibts da vielleicht einfachere Möglichkeiten (bzw. hat das schon mal jemand gemacht und kann den Quelltext hier posten) oder gar Komponenten die das bereits komplett erledigen?

Ich setze üblicherweise die Synapse-Komponenten ein. Und würed das auch hier gerne wieder tun.

Vielen Dank

haentschman 6. Mai 2012 17:08

AW: Komplette Webseite speichern
 
Moin...
Zitat:

...und kann den Quelltext hier posten
Da kommst du um selber machen nicht drum herum. Du mußt dir einen Parser bauen der A: die Links auslesen und listen kann und B: dann aus den jeweiligen Seiten (Links) die Informationen extrahiert.

Valle 6. Mai 2012 17:18

AW: Komplette Webseite speichern
 
Unter Linux kann man einfach wget dafür nehmen:

Code:
wget --recursive http://example.com
Edit:// Wget gibt's sicher auch für Windows. Einfach mal suchen.

Liebe Grüße,
Valentin

Luckie 6. Mai 2012 17:33

AW: Komplette Webseite speichern
 
http://gnuwin32.sourceforge.net/packages/wget.htm

haentschman 6. Mai 2012 17:42

AW: Komplette Webseite speichern
 
Ja alles gut und schön, HTML ist da... Die gewünschten Informationen herausparsen bleibt.

Valle 6. Mai 2012 18:19

AW: Komplette Webseite speichern
 
Zitat:

Zitat von haentschman (Beitrag 1165084)
Ja alles gut und schön, HTML ist da... Die gewünschten Informationen herausparsen bleibt.

Was er auslesen will hat er ja nicht gesagt. Vielleicht hat er dafür ja schon eine Lösung.

Ansonsten ist ein Regex in dem Fall wohl am einfachsten.

Liebe Grüße,
Valentin

eddie11 6. Mai 2012 19:22

AW: Komplette Webseite speichern
 
Ja danke, wget muss ich mir mal ansehen. Scheint genau das zu sein was ich brauche. Die eigentlichen Informationen sollen nicht automatisch abgegriffen werden. Alles was ich haben will sind die Webseiten zur Ansicht.

Danke

madas 7. Mai 2012 08:36

AW: Komplette Webseite speichern
 
Unter C# kannst z.B. das Watin-Framework dafür benutzen.

Assarbad 7. Mai 2012 12:17

AW: Komplette Webseite speichern
 
Zitat:

Zitat von Valle (Beitrag 1165088)
Ansonsten ist ein Regex in dem Fall wohl am einfachsten.

... aber nur wenn es nicht um Parsen geht. Ansonsten mal PEGs anschauen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 08:28 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz