![]() |
Prob. mit Regulären Ausdrücke
Hallo zusammen :)
Erstmal: Die Frage ist über Java, aber ich habe keine Wahl, was die Sprache betrifft ;) Das Problem: Ich habe einige Objekte in einer Datei, und will diese einlesen. Die Dateistruktur ist beliebig, aber sie soll menschenlesbar sein. Ich habe mir ungefär folgendes format ausgedacht:
Code:
Es gibt also Items (erste Ordnung, Klassen wie TAppointment oder TWeekly) und entsprechende Properties Childobjekte.
new TAppointment{
Title="Beispieltitel"; Priority=3; Description="Dies ist eine Beschreibung ...\nMit zwei Zeilen!"; Date=new TDate{ Day=4; Month=2; Year=2007; Time=new TTime{ Hour=17; Minute=5; }; }; }; new TWeekly{ Title="Noch ein Item"; Priority=7; Description="Schon wieder Beschreiben,\naber diesmal ...\nüber drei Zeilen !"; StartDate=new TDate{ Day=4; Month=2; Year=2007; Time=null; }; EndDate=new TDate{ Day=4; Month=2; Year=2007; Time=null; }; DayOfWeek=3; Time=new TTime{ Hour=13; Minute=15; }; }; Nun will ich die Datei parsen ... erstmal wird an allen Zeilenumbrüchen getrennt, und dann getrimmt. Dann kommt folgender Code:
Code:
Token ist ein Teil des Texts, also immer eine Zeile.
if (token.matches("^(new T)")) // new Item-Object to read
{ System.out.println("neues objekt: " + token.substring(4)); } else if (token.matches("^(.+=new T)")) // Child-Object { System.out.println("kind: "); } else if (token.matches("^(.+=\".+\";)")) // String-Property to read { System.out.println("str-property: " + token); } else if (token.matches("^(.+=.+;)")) // Other Property to read { System.out.println("property: " + token); } else // Control-Chars { System.out.println("was anderes: " + token); } Ausgabe, die mir Rätsel aufgibt, ist folgende:# Zitat:
Wie kann ich ihm auf die Sprünge helfen? Kann ich die Regexen noch verbessern? (Das ist nur die Exportfunktion, das eigentliche Speichern wird anders sein ...) MfG, Julius. |
Re: Prob. mit Regulären Ausdrücke
Keiner eine Ahnung? :(
|
Re: Prob. mit Regulären Ausdrücke
Hi!
Ich habe einen ganz anderen Vorschlag für dich. Ein menschen-lesbares Format ist u.a. XML. Da kannst du das, was du da als Beispiel geschrieben hast, wunderbar abbilden. Und Java sollte eigentlich einen XML-Parser intus haben. |
Re: Prob. mit Regulären Ausdrücke
xml halte ich für sowas simples für Overkill...
Da würde ich dir zu JSON raten. Das ist simpel, schnell, du kannst alles dadrin abbilden, was du brauchst und es gibt genügend libs um mit JSON umzugehen (einfach mal auf ![]() Wenn du lieber mit deinem eigenem Format weitermachen willst, dann musst du mir das Problem nochmal genauer erklären... Eigentlich sehe ich in deinem log auch die Unterobjekte... |
Re: Prob. mit Regulären Ausdrücke
Also ich möchte gerne mit meinen Format weitermachen ...
Grund ist der, dass ich das selber Parsen muss, also keinen vollautomatischen Parser verwenden ;) Also kann ich die Struktur der Datei beliebig verändern so, dass das Parsen einfach wird, aber parsen muss ich es schon. Das Problem ist doch, dass die (Unter-)objekte zwar auftauchen, aber als "was anderes" - also werden sie erst im letzten else-Zweig erkannt, aber sie sollen schon vorher mithilfe des regulären Ausdrucks erkannt werden. Und dieser trifft offensichtlich nicht zu :(
Code:
was anderes: Time=new TTime{
was anderes: new TWeekly{ |
Re: Prob. mit Regulären Ausdrücke
Nun... ich würde dir trotzdem emphelen deine Parsingstrategie zu ändern. Denn deine Methode mit den Regexen dürfte verdammt langsam sein und du kommst schnell an die Grenzen der Möglichkeiten...
Ich habe mal einen ini-Dateiparser in Java geschrieben. Den kann ich dir gerne geben, wenn du ein paar Anregungen brauchst. Dein Parser müsste allerdinsg rekursiv aufgebaut sein, da es unbegrentzt viele Unterobejket gibt (ist doch so, oder?). Mein ini-File Parser kommt ohne Rekursion aus :-). Wenn du trotzdem unbedingt bei deiner Parsemethode bleiben willst: Ich denke mal du erwartest, dass diese Bedingung anspringt: token.matches("^(.+=new T)")) Mach's mal so: token.matches("^(.+=new T).*") das sollte funktionieren. Jetzt frag' mich aber nicht, warum matches nicht anspringt, wenn das Ende des Strings nicht mitmatcht. Das sollte meines Erachtens nur dann passieren, wenn ein $ am Ende ist.. Also wenn jemand eine Antwort drauf hat. Und dies ist für sowas manchmal ganz praktisch: ![]() |
Re: Prob. mit Regulären Ausdrücke
Also das Parsen sollte ungefähr so verlaufen, dass erstmal alles entsprechend kategorisiert wird, durch die regexen, und in einer hirachischen Struktur untergebracht wird. Dann wird für jedes Haupt-Objekt dieser Struktur die "Read"-Methode mit einer AttayList<TItem> aufgerufen, die dann ein Objekt des richtigen typs erstellt, es in die ArrayList reintut, und sich dann dem Objekt übergibt, damit das Objekt dann seine privaten Felder füllen kann. Das ist dann rekursiv, und das ist auch gut so ;) Geschwindigkeit spielt keine Rolle ... ist eh in java :mrgreen:
(Klingt vll. ein wenig kompliziert ... ist es vielleicht auch ^^) Edit: Tasache, mit den .* hinten dran geht es wunderbar ... :cyclops: 1. Cool, Danke :) 2. Warum zum Teufel geht es ohne nicht? Doofes Java :stupid: |
Alle Zeitangaben in WEZ +1. Es ist jetzt 05:49 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz