Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Delphi Webseite parsen - Unterschiedliche Quelltexte (https://www.delphipraxis.net/105507-webseite-parsen-unterschiedliche-quelltexte.html)

Yheeky 23. Dez 2007 01:08


Webseite parsen - Unterschiedliche Quelltexte
 
Hi,

folgendes: ich wollte die Webseite www.goyellow.de parsen und habe mir hierfür den Code über meinen Browser Firefox angeschaut. Wenn ich in meinem Programm nun allerdings über die Komponente IdHTTP die Seite anschaue, habe ich einen ganz anderen Quelltext. Wieso das? Wie kann ich den Text von Firefox bekommen?
Ich hoffe mir kann da jemand weiterhelfen. Danke schonmal!

cruiser 23. Dez 2007 01:17

Re: Webseite parsen - Unterschiedliche Quelltexte
 
Du sendest dem Webserver bei der Anfrage den User-agent (glaube das heisst so, ist im Grunde der Browser incl. Version) mit. Darauf kann es sein, dass das Serverscript über eine Browserweiche genau den Quelltext ausgibt, der auf deinem Browser dem gewünschten Resultat am nähesten ist.

TIdHttp hat da irgendwo eine Property für... einfach einstellen und gut

Der HTTP-User-Agent Eintrag beim aktuellen Firefox ist:

Code:
Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11

Yheeky 24. Dez 2007 13:08

Re: Webseite parsen - Unterschiedliche Quelltexte
 
Hey,

also irgendwie geht das nicht. Ich finde zwar die Property aber ich bekomme immer noch nicht den gleichen Inhalt angezeigt.
Ist auch glaube ich nicht die richtige Art bei dem Problem anzusetzen, da alle User ja den gleichen Code angezeigt bekommen sollen und nicht abhängig vom Browser...gibt´s da vielleicht noch eine Möglichkeit?

Euch allen schonmal Frohe Weihnachten! :-)

OregonGhost 25. Dez 2007 14:44

Re: Webseite parsen - Unterschiedliche Quelltexte
 
Zitat:

Zitat von Yheeky
da alle User ja den gleichen Code angezeigt bekommen sollen und nicht abhängig vom Browser...

Wenn man nicht browser-abhängigen Code bekommen würde, könnten eine Menge Nutzer eine Menge Webseiten gar nicht erst betrachten ;)

Der Weg sollte eigentlich schon der richtige sein. Wobei du dich vielleicht statt mit dem Code für einen aktuellen Browser vielleicht eher mit dem Standard-Code zufrieden geben kannst - mit etwas Glück ist der einfacher. Etwas rumprobieren schadet hier nicht. Zusätzliche Änderungen können aber zum Beispiel auch Cookies bewirken (z.B. benutzerdefinierte Einstellungen) oder eventuell etwas esoterischere Browser-Tests.

Davon abgesehen: Warum willst du die Seite parsen? Willst du die Seite fernsteuern? Wenn ja, bietet sie entweder dafür eine explizite Möglichkeit an - oder sie will vielleicht nicht ferngesteuert werden.


Alle Zeitangaben in WEZ +1. Es ist jetzt 10:05 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz