Delphi-PRAXiS
Seite 1 von 2  1 2      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht (https://www.delphipraxis.net/200735-immoscout-seite-mit-idhttp-vollstaendig-einlesen-funkt-nicht.html)

bogdan 20. Mai 2019 17:40

ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Mit IdHTTP.Get versuche ich die folgende Seite einzulesen:

https://www.immobilienscout24.de/expose/111242696

Leider fehlen im Response Text (HTML Quellcode) einige Angaben, wie zb. der Block "Kaufnebenkosten".

Hat Jemand eine Idee woran das liegen könnte?

Der schöne Günther 20. Mai 2019 17:56

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Ohne es angesehen zu haben: Viele Seiten laden Content erst später per JavaScript nach. Unter anderem auch um das "Scraping" von Inhalten zu verhindern:

https://de.wikipedia.org/wiki/Screen...Verschleierung

Man kann dann natürlich einen richtigen Webbrowser nehmen, warten bis die Seite fertig aufgebaut ist und sich dann die Inhalte zusammensuchen, aber das hält auch nur bis zum nächsten Redesign der Seite.

Ich hatte mal aus Spaß versucht mir so etwas für XHamster zu bauen, aber das artet irgendwann nur noch in stupide Fleißarbeit aus...

bogdan 20. Mai 2019 18:11

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Hallo Günther,

ich vermute auch, dass dieser Block erst beim Laden per JavaScript angezeigt wird.

Mit TWebBrowser funktioniert das ja auch und ich kann den Quelltext 100% auslesen.
Das Problem mit dem WebBrowser ist nur, dass sich die Applikation im RAM aufbläht und dann hat man schnell eine Fehlermeldung wegen nicht ausreichendem Arbeitsspeicher.

TWebBrowser.Free funktioniert da auch nicht. Der RAM bleibt voll.

XHamster...yeaah :wink:

Der schöne Günther 20. Mai 2019 18:20

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Der TWebBrowser läuft standardmäßig nur als Internet Explorer 7-Emulation, der kann heute wahrscheinlich gar nichts mehr. Hast du den schon auf IE11 gesetzt?

bogdan 20. Mai 2019 18:27

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Bei FormCreate rufe ich die folgende Procedure auf:

Code:
procedure SetWebbrowserMode(Mode: TIEMode; AppName: string = '');
const
  REG_KEY = 'Software\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BROWSER_EMULATION';
var
  Reg: TRegistry;
  Value: Integer;
begin
  if AppName = '' then AppName := ExtractFileName(Application.ExeName);
  Case Mode of
    iemIE7 : Value := $1B58;
    iemIE8 : Value := $1F40;
    iemIE10 : value := $2710;
    iemIE11 : Value := $2af8;
  end;
  Reg := TRegistry.Create();
  try
    Reg.RootKey := HKEY_CURRENT_USER;
    if Reg.OpenKey(REG_KEY, True) then
    begin
      Reg.WriteInteger(AppName, Value);
      Reg.CloseKey;
    end;
  finally
    Reg.Free;
    end;
end;
Mit WebBrowsers Speicherproblem hat das aber nichts zu tun.

Rollo62 20. Mai 2019 18:29

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Vielleicht hilft dir die Phantom-Js Browser Library ?
http://techslides.com/grabbing-html-...js-or-casperjs
Die müsste man auch mit dem embedded TWebBrowser aufrufen können, und dann damit auch JS-Seiten einlesen und parsen können.

bogdan 20. Mai 2019 18:36

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Hallo Rollo,

danke für den Link. Schaue ich mir mal genauer an.

Schokohase 20. Mai 2019 19:59

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Ich will ja kein Spielverderber sein, aber die AGB für die Nutzung der über die Website www.immobilienscout24.de zugänglichen Services der Immobilien Scout GmbH sagen
Zitat:

8. Rechte an der Datenbank
8.1. ImmobilienScout24 ist Rechtsinhaber an den Inhalten der Website und der Datenbank. Sämtliche Urheber-, Marken-und sonstigen Schutzrechte an dem Datenbankwerk, der Datenbank und den hier eingestellten Inhalten, Daten und sonstigen Elementen stehen ausschließlich ImmobilienScout24 zu; etwaige Rechte des Nutzers an den von ihm eingestellten Inhalten bleiben hiervon unberührt.

8.2. Der Nutzer hat im Rahmen dieser Nutzungsbedingungen das Recht, ausschließlich unter Verwendung der von ImmobilienScout24 zur Verfügung gestellten Online-Suchmasken einzelne Datensätze auf seinem Bildschirm sichtbar zu machen und zur dauerhaften Sichtbarmachung einen Ausdruck zu fertigen. Eine automatisierte Abfrage durch Scripte, durch Umgehung der Suchmaske durch Suchsoftware oder vergleichbare Maßnahmen sind nicht gestattet.

8.3. Der Nutzer darf die durch Abfrage gewonnenen Daten weder vollständig, noch teilweise oder auszugsweise zum Aufbau einer eigenen Datenbank in jeder medialen Form und/oder für eine gewerbliche Datenverwertung oder Auskunftserteilung und/oder für eine sonstige gewerbliche Verwertung verwenden. Die Verlinkung, Integration oder sonstige Verknüpfung der Datenbank oder einzelner Elemente der Datenbank mit anderen Datenbanken oder Meta-Datenbanken ist unzulässig.

bogdan 21. Mai 2019 06:16

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Hallo Schokohase,

Immos AGB sind mir bekannt aber nicht das Thema hier.

Schokohase 21. Mai 2019 06:20

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
 
Zitat:

Zitat von bogdan (Beitrag 1432657)
Hallo Schokohase,

Immos AGB sind mir bekannt aber nicht das Thema hier.

Sind dir die AGBs und Nutzungsbedingungen von diesem Forum auch bekannt? Denn nach denen sind solche Fragen hier nicht gestattet.
Zitat:

Du stehst dafür ein und Du bist dafür alleine verantwortlich, dass die von Dir eingestellten Inhalte nicht gegen gesetzliche Vorschriften oder Rechte Dritter verstoßen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 11:42 Uhr.
Seite 1 von 2  1 2      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz