Einzelnen Beitrag anzeigen

Delphi.Narium

Registriert seit: 27. Nov 2017
2.431 Beiträge
 
Delphi 7 Professional
 
#2

AW: Webpages vergleichen und Änderungen ermitteln

  Alt 17. Nov 2021, 18:39
Mal ein unüblicher Vorschlag:

Selbermachen:

Das Folgende nur für den Teil zwischen den Body-Tags.

1. Vor jede < einen Zeilenumbruch.
2. Hinter jede > einen Zeilenumbruch.
3. alle übrigen Zeilenumbrüche durch ein Leerzeichen ersetzen.
Ergebnis: Tags und Text befinden sich in getrennten Zeilen.
4. Alle Zeilen, die mit < beginnen, entfernen.
5. Alle Textzeilen per Trim von führenden und folgenden Whitespace bereinigen.

Das Ergebnis sollte dann recht einfach per Diff-Tool, TDiff oder ähnlichem, vergleichbar sein.

Voraussetzung:

Halbwegs ordentlich strukturiertes HTML, das nicht mit Javascripten vollgespickt ist.

Sonst müsste man vorher alle Script-Tags suchen und diese (mit dem gesamten Inhalt dazwischen) entfernen, was aber nach dem Einfügen von Zeilenumbrüchen vor < und hinter > recht einfach zu realsieren ist.
  Mit Zitat antworten Zitat