AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Quellcode von TWebbrowser auslesen dauert extrem lang

Quellcode von TWebbrowser auslesen dauert extrem lang

Ein Thema von napsterxx · begonnen am 15. Mär 2009 · letzter Beitrag vom 15. Mär 2009
Antwort Antwort
napsterxx

Registriert seit: 18. Mär 2007
Ort: Borland
556 Beiträge
 
Delphi 7 Enterprise
 
#1

Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:21
Hallo ihr lieben.
Ich fodere mit einer TWebbrowser Komponente eine Website an, diese ist sehr groß (rund 2,2MB) und enthält eine Liste (rund 7000 Einträge). Wenn nun die Website geladen ist hole ich mir den Quellcode, und gehe diesen danach durch, lösche einige Sachen, sodass ich am Ende alle Namen der Einträge habe - funktioniert auch prima - bei 50 Einträgen aber bei 7000 steht eigentlich alles. Es dauert extrem lang den Quellcode du "phrasen" sprich nach den einzelnen Namen zu suchen. Derzeit mache ich das so:

Delphi-Quellcode:
    while(Pos('/download/', swHTMLText) > 0) do
    begin
        Delete(swHTMLText, 1, Pos('/download/', LowerCase(swHTMLText)) + Length('/download'));
        titel := Copy(swHTMLText, 1, Pos('/', swHTMLText)-1);
         ToDo.Add(link);
    end;
Du derefernzierst p2 einmal und weißt die Adresse von i zu. Das heißt p2 (also der Zeiger auf einen Zeiger) zeigt auf den Zeiger p1 welchen du so auf i zeigen lässt.
  Mit Zitat antworten Zitat
omata

Registriert seit: 26. Aug 2004
Ort: Nebel auf Amrum
3.154 Beiträge
 
Delphi 7 Enterprise
 
#2

Re: Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:23
Benutzte doch IdHTTP + Reguläre Ausdrücke.
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.193 Beiträge
 
Delphi 10.4 Sydney
 
#3

Re: Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:25
Zieh mal das LowerCase aus der Schleife raus. Ist unnötig das für jedes Vorkommen ausführen zu lassen.

Und falls die "/downloads/" z.B. nur bei HTML-Links vorhanden sind, so lass dir doch vom Webbrowser-DOM nur die Link-Elemente geben.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
napsterxx

Registriert seit: 18. Mär 2007
Ort: Borland
556 Beiträge
 
Delphi 7 Enterprise
 
#4

Re: Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:36
Also irgendwie finde ich keine mir einileuchtende Lösung wie ich nur z.B. <a> Tags mit deren Inhalt erhalte. Meinst du vielleicht einen XML Phraser?
Du derefernzierst p2 einmal und weißt die Adresse von i zu. Das heißt p2 (also der Zeiger auf einen Zeiger) zeigt auf den Zeiger p1 welchen du so auf i zeigen lässt.
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.858 Beiträge
 
Delphi 11 Alexandria
 
#5

Re: Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:38
Wie erwähnt entweder Tags sequentiell suchen oder per regulären Ausdrücken
Markus Kinzler
  Mit Zitat antworten Zitat
napsterxx

Registriert seit: 18. Mär 2007
Ort: Borland
556 Beiträge
 
Delphi 7 Enterprise
 
#6

Re: Quellcode von TWebbrowser auslesen dauert extrem lang

  Alt 15. Mär 2009, 14:47
Würde ich lieber die Variante mit den Tags einschlagen.

WebBrowser.OleObject.Document.all.tags('A').?? Könnte das so funktionieren?
Du derefernzierst p2 einmal und weißt die Adresse von i zu. Das heißt p2 (also der Zeiger auf einen Zeiger) zeigt auf den Zeiger p1 welchen du so auf i zeigen lässt.
  Mit Zitat antworten Zitat
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 07:47 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz