AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

TRegExpr begrenzt nicht

Ein Thema von TheMiller · begonnen am 2. Jun 2009 · letzter Beitrag vom 2. Jun 2009
Antwort Antwort
Benutzerbild von TheMiller
TheMiller

Registriert seit: 19. Mai 2003
Ort: Gründau
2.480 Beiträge
 
Delphi XE7 Architect
 
#1

TRegExpr begrenzt nicht

  Alt 2. Jun 2009, 20:39
Hallo,

ich möchte einen Text (siehe unten) in verschiedene Teile zerlegen. Ich habe mir eine Mini-Expr. gebastelt (zum Test). Diese enthält eine Gruppe zwischen zwei festen Zeichen-Gruppen:

Code:
pntext\\f0\s(.+)\\tab
An das, was in den Klammern ist, möchte ich ran! Problem ist jetzt, dass diese Art von Zeilen beliebig oft vorkommen. Und die RegExpr-Engine macht folgendes: Sie packt von Fundstelle-1 alles bis zur letzten Fundstelle in ein Match, egal ob diese Fundstellen öfter vorkommen. Hier mal mit Text und Result:

Text:

Code:
{\rtf1\ansi\ansicpg1252\deff0\deflang1031{\fonttbl{\f0\fnil Tahoma;}{\f1\fnil\fcharset0 Tahoma;}}
\viewkind4\uc1\pard\f0\fs16 RichEdit1
\par \pard{\pntext\f0 A.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart0\pnucltr{\pntxta.}}
\f1 asdasd\f0 
\par \pard{\pntext\f0 I.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart1\pnucrm{\pntxta.}}
\li200\f1 asdsad\f0 
\par \pard{\pntext\f0 1.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart1\pndec{\pntxta.}}
\li400\f1 asdasd\f0 
\par \pard{\pntext\f0 a)\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart1\pnlcltr{\pntxta)}}
\li600\f1 asdasd\f0 
\par }
Result:

Code:
A.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart0\pnucltr{\pntxta.}}
\f1 asdasd\f0 
\par \pard{\pntext\f0 I.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart1\pnucrm{\pntxta.}}
\li200\f1 asdsad\f0 
\par \pard{\pntext\f0 1.\tab}{\*\pn\pnlvlbody\pnf0\pnindent0\pnstart1\pndec{\pntxta.}}
\li400\f1 asdasd\f0 
\par \pard{\pntext\f0 a)
gewünschtes Ergebnis:

A.
B.
C.
usw.


Was mache ich falsch? Die Quelle ist übrigens eine RTF (aus Richedit), welche in einem StringStream für RegExp gespeichert ist.

[EDIT]Speichere ich den StringStream wiederum in einem Memo und gehe dann in einer Schleife Zeile für Zeile durch, funktioniert das perfekt... Möchte aber ungerne einen StringStream und dann auch noch eine StringList benutzen... [/EDIT]

Bitte um Hilfe!
  Mit Zitat antworten Zitat
Benutzerbild von ULIK
ULIK

Registriert seit: 25. Sep 2006
Ort: Regensburg
416 Beiträge
 
Delphi 11 Alexandria
 
#2

Re: TRegExpr begrenzt nicht

  Alt 2. Jun 2009, 20:55
Hi,

das Ergebnis ist völlig korrekt (da die RegExp anscheinend im 'gefrässigen' (greedy) Modus arbeitet): finde etwas was mit pntext beginnt, gefolgt von \f0 gefolgt von einem Whitespace gefolgt von mindestes einem beliebigen Zeichen gefolgt von eine \tab. Dein Ergebnis ist der maximal mögliche Treffer! Schau mal, ob die Engine einen Schalter hat, mit dem man den Greedy-Mode ausschalten kann.

Probier's mal mit
Code:
pntext\\f0\s(.+?)\\tab
Grüße,
Uli
  Mit Zitat antworten Zitat
Benutzerbild von TheMiller
TheMiller

Registriert seit: 19. Mai 2003
Ort: Gründau
2.480 Beiträge
 
Delphi XE7 Architect
 
#3

Re: TRegExpr begrenzt nicht

  Alt 2. Jun 2009, 20:57
Nein

Ja, die Engine hat diesen Schalter, ich vergesse ihn immmer und immer wieder!

Ich danke dir - Funktioniert natürlich!!!

Danke!
  Mit Zitat antworten Zitat
omata

Registriert seit: 26. Aug 2004
Ort: Nebel auf Amrum
3.154 Beiträge
 
Delphi 7 Enterprise
 
#4

Re: TRegExpr begrenzt nicht

  Alt 2. Jun 2009, 23:18
Eine andere Variante wäre folgender Schalter...
RegExpr.ModifierG:=false;
  Mit Zitat antworten Zitat
Benutzerbild von TheMiller
TheMiller

Registriert seit: 19. Mai 2003
Ort: Gründau
2.480 Beiträge
 
Delphi XE7 Architect
 
#5

Re: TRegExpr begrenzt nicht

  Alt 2. Jun 2009, 23:21
Ja, den habe ich letztenende gesetzt
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 02:11 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz