AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein Delphi DIV classes mit getElementByID auslesen
Thema durchsuchen
Ansicht
Themen-Optionen

DIV classes mit getElementByID auslesen

Ein Thema von Ajintaro · begonnen am 19. Mai 2014 · letzter Beitrag vom 22. Mai 2014
Antwort Antwort
Volker Z.

Registriert seit: 3. Dez 2012
Ort: Augsburg, Bayern, Süddeutschland
419 Beiträge
 
Delphi XE4 Ultimate
 
#1

AW: DIV classes mit getElementByID auslesen

  Alt 21. Mai 2014, 21:14
Hallo,

Zitat:
Die obige Prozedur speichert den Text zwischen <pre> </pre> nur bis zum 1. Vorkommen eines <br>, der Rest wird nicht mehr mitgenommen. [...] Muss ich da noch eine Schleife über die <br> Knoten hinzufügen ?
Leider ist mir nicht klar was Du mit einer Schleife über die BR-Knoten meinst.

Dein
Code:
<div class="fftText">
<pre>Das ist der 1. Satz<br>Und dies ist der 2. Satz. In diesem Falle mit X<br>Ich mag auch mit !</pre>
</div>
Kann man sich als DOM-Baumstruktur so vorstellen ([-] heißt es existieren Kindknoten, eingerückt heißt Knoten auf derselben Ebene):
Code:
[-]<div class="fftText">
   [-]<pre>
         Das ist der 1. Satz
         <br>
         Und dies ist der 2. Satz. In diesem Falle mit X
         <br>
         Ich mag auch mit !
Wenn Dich die Kinder eines gegeben DOM-Knotens interessieren, dann gibt Dir Node := Node.firstChild; die Referenz auf den ersten Kindknoten - oder nil, falls kein Kindknoten existiert. Wenn Du den DIV-Knoten an procedure AddFFTText (Node : IHTMLDOMNode; var S : string); übergibst, dann liefert die erste Zuweisung den PRE-Knoten und die zweite Zuweisung den Textknoten "Das ist der 1. Satz".
Möchtest Du DOM-Knoten auf derselben Ebene untersuchen, dann sind die Zuweisungen: Node := Node.nextSibling; bzw. Node := Node.previousSibling; hilfreich; erstere liefert eine Referenz auf den nächsten Kindknoten, letztere eine Referenz auf den vorherigen Kindknoten derselben Ebene.

Wenn Du nur die Kinder der ersten Ebene des PRE-Knotens und dann auch nur Textknoten berücksichtigen möchtest: das erste Kind holen, solange diese Knoteneben durchlaufen bis kein weiterer Knoten mehr vorhanden ist, dabei jeden Knoten prüfen, ob es ein Textknoten ist - alles andere links liegen lassen.
In Code gegossen:
Delphi-Quellcode:
procedure AddFFTText (Node : IHTMLDOMNode; var S : string);
begin
  if not (DOMNodeTagNameIs (Node, 'div') and DOMNodeClassNameIs (Node, 'fftText')) then
    Exception.Create ('Fehlermeldung');

  Node := Node.firstChild;
  if not DOMNodeTagNameIs (Node, 'pre') then
    Exception.Create ('Fehlermeldung');

  Node := Node.firstChild;
  while Assigned (Node) do
    begin
      if DOMNodeIsTextNode (Node) then
        AddNodeValue (Node, S);

      Node := Node.nextSibling
    end
 end;
Dann ist auch "Ich mag auch mit !" mit von der Partie.

Ich hoffe ich konnte Deine Frage beantworten.

Zu Deiner Anmerkung: Result := e.className = Name //richtig ist: e._className kann gut sein, dass es ab XE5 oder XE6 mit Unterstrich sein muss.
Und was war da mit der Access violation. Kannst Du dazu mehr sagen?

Gruß
Volker Zeller
  Mit Zitat antworten Zitat
Benutzerbild von Ajintaro
Ajintaro

Registriert seit: 20. Okt 2004
Ort: Sankt Augustin
138 Beiträge
 
Delphi XE6 Starter
 
#2

AW: DIV classes mit getElementByID auslesen

  Alt 22. Mai 2014, 12:44
Hallo nochmal,

Ich hatte heute wieder die Gelegenheit am Code zu arbeiten. Zunächst sei gesagt, dass mir die Sichtweise eines TreeViews im Bezug auf die Arbeit mit DOM nicht nur geholfen, sondern auch inspiriert hat die Elemente als TreeView Knoten darzustellen:

Delphi-Quellcode:
procedure TForm1.Button1Click(Sender: TObject);
var
  d : IHTMLDocument3;
  c : IHTMLElementCollection;
  i,entries : Integer;
  n : IHTMLDOMNode;
  s, datum, logger, group, text: string;
  tn: TTreeNode;


  procedure AddFFTHeader (const Node : IHTMLDOMNode; var S : string);
  var
    n : IHTMLDOMNode;
    //-------------------Timestamp--------------------------------------------------
    procedure AddFFTDateTime (var Node : IHTMLDOMNode; var S : string);
    begin
      if not DOMNodeIsTextNode (Node) then Exception.Create ('AddFFTHeader Error!');
      datum := Node.nodeValue;
      Node := Node.nextSibling
    end;
    //-------------------logger-------------------------------------------------
    procedure AddFFTName (var Node : IHTMLDOMNode; var S : string; const Name : string);
    var
      n : IHTMLDOMNode;
    begin
      n := FindSpanByClassName (Node, Name);
      if not Assigned (n) then Exception.Create ('AddFFTName Error');
      logger := n.nodeValue;
      Node := Node.nextSibling
    end;
    //-------------------Group-------------------------------------------------
    procedure AddFFTgroup (var Node : IHTMLDOMNode; var S : string; const Name : string);
    var
      n : IHTMLDOMNode;
    begin
      n := FindSpanByClassName (Node, Name);
      if not Assigned (n) then Exception.Create ('AddFFTgroup Error');
      group := n.nodeValue;
      Node := Node.nextSibling
    end;

  begin
    n := Node.firstChild;
    AddFFTDateTime (n, S);//Datum adden
    AddFFTName (n, S, 'FFT_header_for_name');
    AddFFTGroup (n, S, 'FFT_header_group');
  end;
  //-------------------TEXT -------------------------------------------------
  procedure AddFFTText (Node : IHTMLDOMNode; var S : string);
  begin
    if not (DOMNodeTagNameIs (Node, 'div') and DOMNodeClassNameIs (Node, 'fftText')) then
      Exception.Create ('DOMNodeTagNameIs error: Weder div noch fftText gefunden');

    Node := Node.firstChild;
    if not DOMNodeTagNameIs (Node, 'pre') then Exception.Create ('DOMNodeTagNameIs error: pre Tag nicht gefunden');

    if assigned(node) then
    begin
      Node := Node.firstChild;
      text := '';
      while Assigned (Node) do
      begin
        if DOMNodeIsTextNode (Node) then
          text := text + ' ' + Node.nodeValue;
          Node := Node.nextSibling
      end;
    end;
  end;

begin
  d := WebBrowser1.Document as IHTMLDocument3;
  if not Assigned (d) then
    Exit;

  c := d.getElementsByTagName ('div');
  for i := 0 to c.length - 1 do
    begin
      n := c.item (i, EmptyParam) as IHTMLDOMNode;
      if not Assigned (n) then
        Exception.Create ('Fehlermeldung');

      if DOMNodeClassNameIs (n, 'FFT_header') then
        begin
          s := '';
          AddFFTHeader (n, s);
          AddFFTText (n.nextSibling, s);

          inc(entries);
          label1.Caption := IntToStr(entries)+' Einträge gefunden';

          //Add Treenode
          tn := Treeview.Items.Add(TreeView.Items.GetFirstNode, datum);
          TreeView.Items.AddChild(tn, logger);
          TreeView.Items.AddChild(tn, group);
          TreeView.Items.AddChild(tn, text);
        end
    end
end;
Ich fühle mich dank euren Erklärungen schon etwas sicherer mit dem Umgang von DOM. Ich habe auch die Access Violation gefunden: es klingt seltsam, aber sobald die Webseite einen meta-tag enthält, ist die Node in:

Delphi-Quellcode:
procedure AddFFTText (Node : IHTMLDOMNode; var S : string);
  begin
    if not (DOMNodeTagNameIs (Node, 'div') and DOMNodeClassNameIs (Node, 'fftText')) then
      Exception.Create ('DOMNodeTagNameIs error: Weder div noch fftText gefunden');

    Node := Node.firstChild;
    if not DOMNodeTagNameIs (Node, 'pre') then Exception.Create ('DOMNodeTagNameIs error: pre Tag nicht gefunden');

    if assigned(node) then
    begin
      Node := Node.firstChild;
      text := '';
      while Assigned (Node) do
      begin
        if DOMNodeIsTextNode (Node) then
          text := text + ' ' + Node.nodeValue;
          Node := Node.nextSibling
      end;
    end;
  end;
immer NIL und deshalb NOT ASSIGNED. Deshalb hab ich ein if assigned(node) eingebaut um den Fehler zu umgehen. Dabei ist es egal was im meta tag steht, die Node ist dann immer NIL...

Ich habe auch einen kleinen Demonstrator gebaut, welchen ich euch gerne zum Testen zur Verfügung stellen kann.
Den Code von Christian werde ich mir jetzt mal anschauen !
Jaimy
DAoC 2.0 -> Camelot Unchained !
  Mit Zitat antworten Zitat
Benutzerbild von Ajintaro
Ajintaro

Registriert seit: 20. Okt 2004
Ort: Sankt Augustin
138 Beiträge
 
Delphi XE6 Starter
 
#3

AW: DIV classes mit getElementByID auslesen

  Alt 22. Mai 2014, 19:26
Guten Abend !

Ich habe mein Problem selbst behoben aufgrund Christian's Code:

Delphi-Quellcode:
LDOC := TcsHTMLDocument.Create;
LDOC.Content := Memo1.Text;
Damit muss ich nicht mit dem original HTML Dokument leben und kann mich auf die Bereiche konzentrieren, welche ich auswerten möchte. Vielen, vielen Dank für dein Beispiel, jetzt hab ich 2 sehr geniale Ansätze um mich mit den HTML Elementen vertrauter zu machen
Jaimy
DAoC 2.0 -> Camelot Unchained !
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:15 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz