AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Daten aus HTML-Code auslesen (RegEx,...)

Ein Thema von Helmi · begonnen am 6. Feb 2025 · letzter Beitrag vom 11. Feb 2025
 
Delphi.Narium

Registriert seit: 27. Nov 2017
2.558 Beiträge
 
Delphi 7 Professional
 
#4

AW: Daten aus HTML-Code auslesen (RegEx,...)

  Alt 6. Feb 2025, 10:13
Zuerst die Datei in eine Stringliste einlesen. Dann alle Zeilen von führenden und folgenden Leerzeichen befreien.

Dann die Datei in eine Stream schieben und diesen zeichenweise in einen zweiten Stream schreiben. Dabei vor allen < einen Zeilenumbruch schreiben und hinter jedem > ebenfalls einen Zeilenumbruch schreiben. Alle vorhandenen Zeilenumbrüche werden durch ein Leerzeichen ersetzt.

Das Ergebnis wieder in die Stringliste kopieren.

Dort hast Du dann alle Tags und Texte jeweils in einer eigenen Zeile.

Aus
HTML-Code:
            <tr>
                <td>
                    Diesel
                </td>
                <td><a href="/tankstelle/bft-1696" rel="nofollow">1,529</a></td>
            </tr>
wird dann
HTML-Code:
<tr>
<td>
Diesel
</td>
<td>
<a href="/tankstelle/bft-1696" rel="nofollow">
1,529
</a>
</td>
</tr>
Nun kannst Du am Anfang der Stringliste alle Zeilen bis einschließlich </thead> löschen.
Am Ende der Stringliste löschst Du alle Zeilen bis zum letzten </tr>.

Damit hast Du nun nur noch den Tabelleninhalt in der Stringliste.

Anschließend löschst Du alle Zeilen, die nicht mit einem < beginnen.
Die verbleibenden Zeilen befreist Du von führenden und folgenden Leerzeichen.
Leere Zeilen werden anschließend entfernt.

Übrig bleiben dann
Code:
Diesel
1,529
Super E10
1,359
Super E5
1,564
Lässt sich mit 'ner Reihe von For-Schleifen recht einfach und schnell realisieren.

Geändert von Delphi.Narium ( 6. Feb 2025 um 10:25 Uhr)
  Mit Zitat antworten Zitat
 


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 04:55 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz