Delphi-PRAXiS
Seite 2 von 2     12   

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Delphi TWebbrowser - Quellcode auslesen (https://www.delphipraxis.net/105767-twebbrowser-quellcode-auslesen.html)

ferby 30. Dez 2007 14:14

Re: TWebbrowser - Quellcode auslesen
 
Hallo,

thx jetzt hab ich mal die Ursache des Problems, der String-Stream wird nie größer als 4096 und deshlab wird immer abgeschnitten....

Aber wie löße ich das Problem jetzt?

ferby 30. Dez 2007 15:29

Re: TWebbrowser - Quellcode auslesen
 
Hello,

hmm, ich glaub es liegt nichtmal an dem StringStream, da ich den länger als 4096 Zeichen machen kann.

Wo kann den hier eine Begrenzung sein?

Delphi-Quellcode:
function WB_GetHTMLCode(WebBrowser: TWebBrowser): string;
var
  ps: IPersistStreamInit;
  ss: TStringStream;
  sa: IStream;
begin
  // Warten bis Quellcode fertig heruntergeladen ist
  repeat
    Application.ProcessMessages;
  until WebBrowser.ReadyState >= 3;

  ps := WebBrowser.Document as IPersistStreamInit;
  ss := TStringStream.Create('');

  try
    sa := TStreamAdapter.Create(ss, soReference) as IStream;
    Succeeded(ps.Save(sa, True));
    Result:=ss.Datastring;
  finally
    ss.Free;
  end;
end;

Bzw, wie erweitere ich diese Grenze sodas ich mehr als 4096 Zeichen Speichern kann?

marabu 12. Jan 2008 21:00

Re: TWebbrowser - Quellcode auslesen
 
Hallo Ferdinand,

zwar hat dein Thread schon einen Bart, aber wenn du noch grübeln solltest:

Der Zugriffsfehler beim ersten Klicken entsteht durch deinen zu frühen Zugriff auf das Document, welches noch nicht existiert (Document = nil). Später dann greifst du beim ersten Klicken immer auf das zuvor geladene Teildokument (wird ja nie vollständig geladen) zu.

Du fügst deinen WebBrowser zur Laufzeit hinzu, klinkst ihn aber nicht in die Nachrichtenkette ein (Parent = nil) - so kommt es früher oder später zu Problemen. Wie du bemerkst, kannst du nur auf das erste Markup-Paket zugreifen, das dein Browser empfängt. Füge den Browser zur Entwurfszeit ein oder mache sein Control zu einem message-only window.

Und nicht zuletzt: Wenn du auf das Dokument eines WebBrowsers beim Ereignis OnDocumentComplete() zugreifst, dann tust du es garantiert zum richtigen Zeitpunkt.

Delphi-Quellcode:
type
  TDemoForm = class(TForm)
    Button: TButton;
    Edit: TEdit;
    procedure ButtonClick(Sender: TObject);
    procedure DocumentComplete(Sender: TObject;
      const pDisp: IDispatch; var URL: OleVariant);
    procedure FormCreate(Sender: TObject);
  private
    wb: TWebBrowser;
  end;

// ...

function WB_GetHTMLCode(WebBrowser: TWebBrowser): string;
var
  ps: IPersistStreamInit;
  ss: TStringStream;
  sa: IStream;
  s: string;
  bool: boolean;
begin
  ps := WebBrowser.Document as IPersistStreamInit;
  s := '';
  ss := TStringStream.Create(s);
  try
    sa := TStreamAdapter.Create(ss, soReference) as IStream;
    bool := Succeeded(ps.Save(sa, True));
    if bool then Result:=Result +#10+ ss.Datastring;
  finally
    ss.Free;
  end;
end;

procedure TDemoForm.ButtonClick(Sender: TObject);
begin
  WB.Navigate(Edit.text);
end;

procedure TDemoForm.DocumentComplete(Sender: TObject;
  const pDisp: IDispatch; var URL: OleVariant);
begin
  with Sender as TWebBrowser do
    if pDisp = DefaultInterface then
      ShowMessage(wb_gethtmlcode(WB));
end;

procedure TDemoForm.FormCreate(Sender: TObject);
begin
  wb := TWebBrowser.Create(self);
  wb.ParentWindow := HWND(HWND_MESSAGE);
  wb.OnDocumentComplete := DocumentComplete;
end;
Die von Lars verwendete Bedingung (State >= 4) ist in Ordnung, deine (State >= 3) in Verbindung mit dem behinderten Nachrichtenfluss ist Schuld am verkürzten Markup.

Freundliche Grüße

ferby 14. Jan 2008 09:53

Re: TWebbrowser - Quellcode auslesen
 
hallo,

danke für die antwort, werd den code mal ausprobieren.

ich habe das ganze mittlerweile so gelößt:

URLDownloadToFile(nil,PChar(Website),PChar(TempDat ei),0,nil);

und lade dann einfach den Quellcode aus der Datei

peter314 30. Sep 2010 18:05

AW: TWebbrowser - Quellcode auslesen
 
Hallo allerseits,
wollt kein neuen Thread aufmachen, weil das Thema hier eigentlich schon zur genüge breitgetreten ist, aber irgendwie will das bei mir nicht.
Ich hab jetzt schon mit jeder Funktion die ich hier gefunden habe versucht den Quelltext der aktuellen Seite meines TWebBrowsers auszulesen, aber beim ausführen erhalte ich immer ein Access Violation.
Code:
uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, ActiveX, ComObj;
{...}
procedure TForm1.Button1Click(Sender: TObject);
var
htmlcode: string;
begin
 WebBrowser1.Navigate('http://wortsuche.com/by-length/4a/');
 htmlcode:= WebBrowser1.OleObject.Document.documentElement.innertext;
 Showmessage(Copy(htmlcode,1,20));
end;
Ich weiß einfach nicht mehr weiter. Über Lösungsvorsschläge würd ich mich sehr freuen.

Dank im Vorraus,
Peter314

peter314 3. Okt 2010 22:30

AW: TWebbrowser - Quellcode auslesen
 
Okay hab das Problem gefunden!
Der Webbrowser hat noch nicht fertig geladen, wenn das Programm bereits den Quelltext auslesen will. Das geht natürlich nicht.

greets Peter

Die Frage hat sich damit natürlich gelöst, nur wie schließt man jetzt die "offene Frage"?

Sir Rufo 3. Okt 2010 23:30

AW: TWebbrowser - Quellcode auslesen
 
Ja, so steht es doch auch hier im Thread


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:48 Uhr.
Seite 2 von 2     12   

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz