AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Regex: Teil des Datenamens erfassen

Ein Thema von MyRealName · begonnen am 26. Aug 2022 · letzter Beitrag vom 27. Aug 2022
Antwort Antwort
Benutzerbild von MyRealName
MyRealName

Registriert seit: 19. Okt 2003
Ort: Heilbronn
673 Beiträge
 
Delphi 10.4 Sydney
 
#1

Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 11:14
Hallo, ich verzweifel gerade an einem Regex (nichts neues, ich bin k..cke mit RegEx)...

Ich habe einen Dateinamen in folgendem Format : POST_123456789_12345678_XX123456/01-2022-123456789-654321-Lieferschein.tif
Davon möchte ich den Teil vor dem Lieferschein (fett markiert) herauslesen. Vorhergehende Nummern müssen nicht immer die gleiche Länge haben, aber die Anzahl der Blöcke und die Trennzeichen (_-/) sind immer da.

Ideen ?
  Mit Zitat antworten Zitat
BerndS

Registriert seit: 8. Mär 2006
Ort: Jüterbog
480 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 11:21
Mit geht es mit RegEx ähnlich. In diesem Fall würde ich ein String.Split verwenden.
Delphi-Quellcode:
var
  SA: TArray<string> ;
  Nr: string;
begin
  ...
  SA := AFileName.Split(['_','-']);
  if Length(SA) = 9 then
  begin
    Nr := SA[7];
   ...
  end;
  ...
end;
Die RegEx Profis haben da möglicherweise eine besseren Vorschlag.
Bernd
  Mit Zitat antworten Zitat
Benutzerbild von MyRealName
MyRealName

Registriert seit: 19. Okt 2003
Ort: Heilbronn
673 Beiträge
 
Delphi 10.4 Sydney
 
#3

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 11:32
Das ist leider zu spezifisch, ich wollte eine Steuertabelle machen, wo ich unter anderem sagen kann, dass das Feld <Feldname>=Dateiname(<RegEx>) so zu finden ist. Jeder Eintrag der mit -_/ getrennt ist, ist ein Wert, den man lesen kann. Im Moment brauche ich nur einen. Damit es immer gleich ist von der Herangehensweise, würde ich das gerne mit RegEx lösen wollen.
Aber danke!
  Mit Zitat antworten Zitat
Benutzerbild von jaenicke
jaenicke

Registriert seit: 10. Jun 2003
Ort: Berlin
9.346 Beiträge
 
Delphi 11 Alexandria
 
#4

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 11:40
Ich weiß nicht, ob es einfacher geht, aber eine Möglichkeit wäre so (sprich 5 Gruppen mit Zahlen, X und / gefolgt von - oder _ und dann die Zahl, die dich interessiert):
Code:
POST_([0-9X\/]*[\-\_]){5}([0-9]*)\-Lieferschein\.tif
Was davon noch variabler sein muss, müsstest du schauen.

Ich weiß nicht, ob du das kennst, aber es gibt auch Testseiten wie diese:
https://regex101.com/
Sebastian Jänicke
Alle eigenen Projekte sind eingestellt, ebenso meine Homepage, Downloadlinks usw. im Forum bleiben aktiv!
  Mit Zitat antworten Zitat
Monday

Registriert seit: 24. Aug 2012
103 Beiträge
 
FreePascal / Lazarus
 
#5

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 12:06
So?!
Code:
-([0-9]{6})-Lieferschein.tif$

So hat man gleich alle Gruppen (7 Gesamt):

Code:
POST_([0-9]{9})_([0-9]{8})_(XX[0-9]{6})\/([0-9]{2})-([0-9]{4})-([0-9]{9})-([0-9]{6})-Lieferschein.tif$

Geändert von Monday (26. Aug 2022 um 12:12 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von MyRealName
MyRealName

Registriert seit: 19. Okt 2003
Ort: Heilbronn
673 Beiträge
 
Delphi 10.4 Sydney
 
#6

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 12:37
Ich weiß nicht, ob es einfacher geht, aber eine Möglichkeit wäre so (sprich 5 Gruppen mit Zahlen, X und / gefolgt von - oder _ und dann die Zahl, die dich interessiert):
Code:
POST_([0-9X\/]*[\-\_]){5}([0-9]*)\-Lieferschein\.tif
Was davon noch variabler sein muss, müsstest du schauen.

Ich weiß nicht, ob du das kennst, aber es gibt auch Testseiten wie diese:
https://regex101.com/
wenn man das X gegegn A-Z tauscht, geht es (mit XX meinte ich, dass da Buchstaben stehen), den Originaldateinamen kann ich ja wegen Datenschutz nicht zeigen
das sieht dann so aus:

Code:
POST_([0-9A-Z\/]*[\-\_]){5}([0-9]*)\-(?i)Lieferschein\.(?i)tif
Zusätzlich habe ich Lieferschein und tif noch case-insensitive gemacht.

So?!
Code:
-([0-9]{6})-Lieferschein.tif$

So hat man gleich alle Gruppen (7 Gesamt):

Code:
POST_([0-9]{9})_([0-9]{8})_(XX[0-9]{6})\/([0-9]{2})-([0-9]{4})-([0-9]{9})-([0-9]{6})-Lieferschein.tif$
Das scheint mir zu statisch, weil Die Längen der Zeichenketten immer fix angegeben sein müssen. Das kann ich aber nicht beinflussen, das kommt von Extern und wenn deren Rechnungsnummer zum Bsp. ein Teil der Zeichenkette ist und die von 3- auf 4-stellig wechselt, dann passt es schon nicht mehr.
  Mit Zitat antworten Zitat
shebang

Registriert seit: 7. Feb 2020
97 Beiträge
 
Delphi 11 Alexandria
 
#7

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 16:19
Code:
(?:[0-9A-Za-z]+)
gibt dir jeweils ein Match für alle von Sonderzeichen separierten Teile deines Dateinamens, siehe https://regex101.com/r/SXpUsR/1
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.139 Beiträge
 
Delphi 12 Athens
 
#8

AW: Regex: Teil des Datenamens erfassen

  Alt 26. Aug 2022, 18:08
Warum so kompliziert?

[0-9A-Za-z]+
bzw. wenn case-insensitive
[0-9A-Z]+

und falls z.B. - oder / mit zum "Text" gehören, dann die auch noch mit rein, z.B.
[0-9a-z-]+ (Modifier i nicht vergessen, oder A-Z wieder rein)
[0-9-]+|[0-9a-z]+ ähhhh (?!-)[0-9-]+(?<!-)|[0-9a-z]+
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests

Geändert von himitsu (26. Aug 2022 um 18:20 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von MyRealName
MyRealName

Registriert seit: 19. Okt 2003
Ort: Heilbronn
673 Beiträge
 
Delphi 10.4 Sydney
 
#9

AW: Regex: Teil des Datenamens erfassen

  Alt 27. Aug 2022, 18:34
ah cool, das verstehe ich sogar :O
Danke!
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 00:06 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz