AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi TWebbrowser - Quellcode auslesen
Thema durchsuchen
Ansicht
Themen-Optionen

TWebbrowser - Quellcode auslesen

Offene Frage von "Sir Rufo"
Ein Thema von ferby · begonnen am 29. Dez 2007 · letzter Beitrag vom 3. Okt 2010
Antwort Antwort
Seite 2 von 2     12   
ferby

Registriert seit: 15. Aug 2004
Ort: Wien
841 Beiträge
 
Delphi 2010 Enterprise
 
#11

Re: TWebbrowser - Quellcode auslesen

  Alt 30. Dez 2007, 14:14
Hallo,

thx jetzt hab ich mal die Ursache des Problems, der String-Stream wird nie größer als 4096 und deshlab wird immer abgeschnitten....

Aber wie löße ich das Problem jetzt?
  Mit Zitat antworten Zitat
ferby

Registriert seit: 15. Aug 2004
Ort: Wien
841 Beiträge
 
Delphi 2010 Enterprise
 
#12

Re: TWebbrowser - Quellcode auslesen

  Alt 30. Dez 2007, 15:29
Hello,

hmm, ich glaub es liegt nichtmal an dem StringStream, da ich den länger als 4096 Zeichen machen kann.

Wo kann den hier eine Begrenzung sein?

Delphi-Quellcode:
function WB_GetHTMLCode(WebBrowser: TWebBrowser): string;
var
  ps: IPersistStreamInit;
  ss: TStringStream;
  sa: IStream;
begin
  // Warten bis Quellcode fertig heruntergeladen ist
  repeat
    Application.ProcessMessages;
  until WebBrowser.ReadyState >= 3;

  ps := WebBrowser.Document as IPersistStreamInit;
  ss := TStringStream.Create('');

  try
    sa := TStreamAdapter.Create(ss, soReference) as IStream;
    Succeeded(ps.Save(sa, True));
    Result:=ss.Datastring;
  finally
    ss.Free;
  end;
end;

Bzw, wie erweitere ich diese Grenze sodas ich mehr als 4096 Zeichen Speichern kann?
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#13

Re: TWebbrowser - Quellcode auslesen

  Alt 12. Jan 2008, 21:00
Hallo Ferdinand,

zwar hat dein Thread schon einen Bart, aber wenn du noch grübeln solltest:

Der Zugriffsfehler beim ersten Klicken entsteht durch deinen zu frühen Zugriff auf das Document, welches noch nicht existiert (Document = nil). Später dann greifst du beim ersten Klicken immer auf das zuvor geladene Teildokument (wird ja nie vollständig geladen) zu.

Du fügst deinen WebBrowser zur Laufzeit hinzu, klinkst ihn aber nicht in die Nachrichtenkette ein (Parent = nil) - so kommt es früher oder später zu Problemen. Wie du bemerkst, kannst du nur auf das erste Markup-Paket zugreifen, das dein Browser empfängt. Füge den Browser zur Entwurfszeit ein oder mache sein Control zu einem message-only window.

Und nicht zuletzt: Wenn du auf das Dokument eines WebBrowsers beim Ereignis OnDocumentComplete() zugreifst, dann tust du es garantiert zum richtigen Zeitpunkt.

Delphi-Quellcode:
type
  TDemoForm = class(TForm)
    Button: TButton;
    Edit: TEdit;
    procedure ButtonClick(Sender: TObject);
    procedure DocumentComplete(Sender: TObject;
      const pDisp: IDispatch; var URL: OleVariant);
    procedure FormCreate(Sender: TObject);
  private
    wb: TWebBrowser;
  end;

// ...

function WB_GetHTMLCode(WebBrowser: TWebBrowser): string;
var
  ps: IPersistStreamInit;
  ss: TStringStream;
  sa: IStream;
  s: string;
  bool: boolean;
begin
  ps := WebBrowser.Document as IPersistStreamInit;
  s := '';
  ss := TStringStream.Create(s);
  try
    sa := TStreamAdapter.Create(ss, soReference) as IStream;
    bool := Succeeded(ps.Save(sa, True));
    if bool then Result:=Result +#10+ ss.Datastring;
  finally
    ss.Free;
  end;
end;

procedure TDemoForm.ButtonClick(Sender: TObject);
begin
  WB.Navigate(Edit.text);
end;

procedure TDemoForm.DocumentComplete(Sender: TObject;
  const pDisp: IDispatch; var URL: OleVariant);
begin
  with Sender as TWebBrowser do
    if pDisp = DefaultInterface then
      ShowMessage(wb_gethtmlcode(WB));
end;

procedure TDemoForm.FormCreate(Sender: TObject);
begin
  wb := TWebBrowser.Create(self);
  wb.ParentWindow := HWND(HWND_MESSAGE);
  wb.OnDocumentComplete := DocumentComplete;
end;
Die von Lars verwendete Bedingung (State >= 4) ist in Ordnung, deine (State >= 3) in Verbindung mit dem behinderten Nachrichtenfluss ist Schuld am verkürzten Markup.

Freundliche Grüße
  Mit Zitat antworten Zitat
ferby

Registriert seit: 15. Aug 2004
Ort: Wien
841 Beiträge
 
Delphi 2010 Enterprise
 
#14

Re: TWebbrowser - Quellcode auslesen

  Alt 14. Jan 2008, 09:53
hallo,

danke für die antwort, werd den code mal ausprobieren.

ich habe das ganze mittlerweile so gelößt:

URLDownloadToFile(nil,PChar(Website),PChar(TempDat ei),0,nil);

und lade dann einfach den Quellcode aus der Datei
  Mit Zitat antworten Zitat
peter314

Registriert seit: 3. Dez 2008
22 Beiträge
 
#15

AW: TWebbrowser - Quellcode auslesen

  Alt 30. Sep 2010, 18:05
Hallo allerseits,
wollt kein neuen Thread aufmachen, weil das Thema hier eigentlich schon zur genüge breitgetreten ist, aber irgendwie will das bei mir nicht.
Ich hab jetzt schon mit jeder Funktion die ich hier gefunden habe versucht den Quelltext der aktuellen Seite meines TWebBrowsers auszulesen, aber beim ausführen erhalte ich immer ein Access Violation.
Code:
uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, ActiveX, ComObj;
{...}
procedure TForm1.Button1Click(Sender: TObject);
var
htmlcode: string;
begin
 WebBrowser1.Navigate('http://wortsuche.com/by-length/4a/');
 htmlcode:= WebBrowser1.OleObject.Document.documentElement.innertext;
 Showmessage(Copy(htmlcode,1,20));
end;
Ich weiß einfach nicht mehr weiter. Über Lösungsvorsschläge würd ich mich sehr freuen.

Dank im Vorraus,
Peter314
  Mit Zitat antworten Zitat
peter314

Registriert seit: 3. Dez 2008
22 Beiträge
 
#16

AW: TWebbrowser - Quellcode auslesen

  Alt 3. Okt 2010, 22:30
Okay hab das Problem gefunden!
Der Webbrowser hat noch nicht fertig geladen, wenn das Programm bereits den Quelltext auslesen will. Das geht natürlich nicht.

greets Peter

Die Frage hat sich damit natürlich gelöst, nur wie schließt man jetzt die "offene Frage"?

Geändert von peter314 ( 3. Okt 2010 um 22:32 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#17

AW: TWebbrowser - Quellcode auslesen

  Alt 3. Okt 2010, 23:30
Ja, so steht es doch auch hier im Thread
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 15:15 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz