Delphi-PRAXiS
Seite 2 von 3     12 3      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks (https://www.delphipraxis.net/84307-%5Bphp%5D-regulaerer-ausdruck-zum-filtern-eines-hyperlinks.html)

MathiasSimmack 28. Jan 2007 17:33

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Ähnliche Frage, darum möchte ich ungern einen neuen Beitrag schreiben. Wenn ich jetzt mehrere Links oder andere HTML-Elemente filtern möchte, dann klappt das wunderbar, solange sich die Elemente nicht wiederholen. Dieses Beispiel:
Code:
[url="bla"]Huhu[/url] <div>Was auch immer</div>
könnte ich quasi "zerlegen", wenn ich nach "a" und "div" filtere. Kommt am Schluss aber noch ein "a" dazu
Code:
[url="bla"]Huhu[/url] <div>Was auch immer</div> <a>ding</a>
dazu, dann findet mein Ausdruck leider nur noch den kompletten String vom ersten <a bis zum letzten a>. Kann ich das irgendwie vermeiden, so dass nur die einzelnen Elemente gefunden werden?

Ich habe vergessen zu erwähnen, dass die Elemente nach bestimmten Namen gefiltert werden. Eine allgemeine Anfrage, die nur nach der HTML-Syntax geht, reicht hier nicht.

Meflin 28. Jan 2007 17:41

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
klar...
Code:
<[^>]*?>(.*?)<\/[^>].*?>
sollte alle elemente einzeln filtern... bei nested tags wird das ganze allerdings nicht mehr hinhauen, also sowas wie
Code:
<div><div></div></div>
aber das war ja nicht das problem oder?
alle links bekommst du mit
Code:
<a[^>]*?>(.*?)<\/a>
edit: ich verstehe dein edit nicht ganz :gruebel:


MathiasSimmack 28. Jan 2007 18:27

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Mein Edit bedeutet, dass ich eben nicht pauschal nach allen HTML-Tags suchen kann/will, sondern es werden nur bestimmte gebraucht. Der erste reguläre Ausdruck ist also nicht das, was ich suche.

Und ich habe im Moment das Problem mit "nested tags", auch wenn es nicht mal die selben sind. Wie gesagt:
Code:
<a>ding</a> <h1>dong</h1> <a>blupp</a>
findet bei mir momentan noch den kompletten String, weil er ja mit einem <a>-Tag anfängt und auch aufhört. Der reguläre Ausdruck soll also die drei einzelnen Elemente erkennen. Das ist mein Problem.

omata 28. Jan 2007 18:29

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Schalte mal über den Parameter U auf nicht gierig um.

Gruss
Thorsten

MathiasSimmack 28. Jan 2007 18:33

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Habe ich schon. Es spielt doch keine Rolle, dass es sich um "konvertierte" HTML-Tags handelt? Also die spitze Klammer < ist im Code &lt;. Ich meine, ob ich nun die spitze Klammer angebe oder den konvertierten String sollte doch unerheblich sein.

Meflin 28. Jan 2007 18:37

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Zitat:

Zitat von MathiasSimmack
Habe ich schon. Es spielt doch keine Rolle, dass es sich um "konvertierte" HTML-Tags handelt? Also die spitze Klammer < ist im Code &lt;. Ich meine, ob ich nun die spitze Klammer angebe oder den konvertierten String sollte doch unerheblich sein.

Also das was du immer so als Beispiel postest sind KEINE nested tags! damit sollte die RegEx die ich mit a als Beipsiel gepostet habe funktionieren, du musst dann nur eben das a mit h1, h2 h3 oder was für Tags du eben matchen willst, ersetzen!


MathiasSimmack 28. Jan 2007 18:37

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Mache ich es so, würde es gehen:
Code:
<a[^>]*?>(.[color=red][^<][/color]*[color=red][^<][/color]?)<\/a>
Ich möchte ja nicht, dass zwischen den Tags noch mal eine spitze Klammer aufgeht. Von daher dachte ich an obige Lösung. Gut so? Bessere Ideen?

omata 28. Jan 2007 18:41

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Hallo,

Code:
preg_match_all(
  '/<(.*)>(.*)<\/(.*)>/U',
  '<a>ding</a> <h1>dong</h1> <a>blupp</a>',
  $match
);
liefert bei mir folgendes...
Code:
Array
(
    [0] => Array
        (
            [0] => <a>ding</a>
            [1] => <h1>dong</h1>
            [2] => <a>blupp</a>
        )

    [1] => Array
        (
            [0] => a
            [1] => h1
            [2] => a
        )

    [2] => Array
        (
            [0] => ding
            [1] => dong
            [2] => blupp
        )

    [3] => Array
        (
            [0] => a
            [1] => h1
            [2] => a
        )

)

Gruss
Thorsten

MathiasSimmack 28. Jan 2007 20:01

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
Hm, ich will nicht ausschließen, dass ich irgendwo einen Fehler gemacht habe. Ich stehe mit den regulären Ausdrücken ein wenig auf Kriegsfuß. :cry: Egal. Zurzeit ist mein WordPress-Plugin fertig. Ich denke zwar, dass es so was schon geben wird, aber ich wollte es mal selbst programmieren: eine Suchfunktion für fremde Seiten. :stupid: Ähnlich wie das [dp]-Suchtag, sozusagen. Bisher laufen <google>, <heise> und <wikipedia>. Die werden direkt im Texteditor eingegeben und müssen dann natürlich als &lt;google&gt; usw. geparst.

Ich werde morgen lokal (auf meinem Ubuntu) mal einen ausgedehnten Bug-Versuch starten und diverse Suchtags nacheinander auflisten und gucken, ob es irgendwann in irgendeiner Kombination ein Problem gibt. :lol:

MathiasSimmack 29. Jan 2007 19:23

Re: [PHP] Regulärer Ausdruck zum Filtern eines Hyperlinks
 
:lol: Ich hab's gewusst. In meiner Anfrage
Code:
"#&lt;".$searchEngines[$i]["name"]."(=(.*?))?&gt;(.*[^&lt;*]?)&lt;\/".$searchEngines[$i]["name"]."&gt;#Usi"
war noch ein Fehler. So klappten zwar die Einzelaufrufe à la
Code:
<heise>Vista</heise> <google>Delphi</google> <heise>Counterstrike</heise>
ohne Probleme, aber sobald ich die erweiterte Syntax nutzen wollte
Code:
<heise=MacOS>Vista</heise> <google>Test</google> <heise>WordPress</heise>
hat er die zwei <heise>-Tags zusammengefasst. Jetzt habe ich in der Anfrage das Fragezeichen weggelassen:
Code:
"#&lt;".$searchEngines[$i]["name"]."(=(.*[color=red][b][s]?[/s][/b][/color]))?&gt;(.*[^&lt;*]?)&lt;\/".$searchEngines[$i]["name"]."&gt;#Usi"
und siehe da, jetzt klappt es. :stupid: Augenscheinlich.


Alle Zeitangaben in WEZ +1. Es ist jetzt 07:40 Uhr.
Seite 2 von 3     12 3      

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz