Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   RegEx - Unicode vs. Posix für alle druckbaren Zeichen (https://www.delphipraxis.net/141654-regex-unicode-vs-posix-fuer-alle-druckbaren-zeichen.html)

worker 13. Okt 2009 12:55


RegEx - Unicode vs. Posix für alle druckbaren Zeichen
 
Hallo,

die Posix-Zeichenklasse [:print:] umfasst alle druckbaren Zeichen, sowie das Leerzeichen.

Gibt es auch eine deratige Unicode-Eigenschaft, die alle druckbaren Zeichen sowie das Leerzeichen umfasst?

worker 18. Okt 2009 21:00

Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
 
So, nun muss ich dieses Thema dochmal pushen; niemand eine Idee? :(

himitsu 18. Okt 2009 21:11

Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
 
also das ist eine Sammlung aller in XML erlaubten Unicodezeichen (diese dürften auch alle druckbar sein und sind vermutlich auch alle sichbar, bis auf ein paar "Leerzeichen")
Code:
#$09, #$0A, #$0D, #$20..#$007E, #$0085, #$00A0..#$D7FF, #$E000..#$FDCF, #$FDE0..#$FFFD
wenn du da einfach die ersten 3 (Tabulator und Zeilenumbruck) wegläßt und dieses in ein RegEx-Suchmuster umwandelst, dann sollte es doch ausreichen?

worker 21. Okt 2009 09:05

Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
 
Danke himitsu,

das hat mich zur Lösung gebracht - einfach den Ausdruck negieren :)
Code:
\P{Cc}


Alle Zeitangaben in WEZ +1. Es ist jetzt 04:40 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz