AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Der schnellste weg Dateien zu parsen?

Offene Frage von "Relicted"
Ein Thema von Relicted · begonnen am 15. Sep 2006 · letzter Beitrag vom 21. Sep 2006
Antwort Antwort
alzaimar
(Moderator)

Registriert seit: 6. Mai 2005
Ort: Berlin
4.956 Beiträge
 
Delphi 2007 Enterprise
 
#1

Re: Der schnellste weg Dateien zu parsen?

  Alt 21. Sep 2006, 09:42
LEX ist ein Programm, das einen Scanner / Tokenizer erzeugt. Du definierst, was die Sprachelemente sind, also Schlüsselwörter, Identifier, Zahlen, terminale Symbole (alle Zeichen, die NICHT Bestandteil eines Wortes sind) usw. Und LEX erzeugt eine Delphi-Unit, das einen Input-Stream in die einzelnen Wörter der Sprache aufteilt und hintereinander die Wörter liefert.

Das dient dann als Input für einen Parser. Der Tokenizer würde z.B. 'begin foobar; end.' in folgende Sequenz übersetzen (1 2 3 4 5). Vorher hast Du ihm gesagt, das das reservierte Schlüsselwort 'begin' den Wert '1' bekommt, ein Identifier den Wert '2', ein Semikolon den Wert '3', das Wort 'end' den Wert '4' und der Punkt den Wert '5'.

Der Input 'begin foobar; blafasel; Begin end; End.' wäre dann '1 2 3 2 3 1 4 3 4 5'.

Anmerkung: LEX erzeugt ursprünglich natürlich C-Code, weil es für UNIX geschrieben wurde. Aber mittlerweile gibt es auch eine gute Implementierung für Delphi. Such mal danach.

Alternativ kannst Du natürlich auch einen 'Frickelparser' basteln, der eventuell doch schneller als ein DEA ist (wenn die Sprache nur wenig reservierte Schlüsselwärter besitzt).
"Wenn ist das Nunstruck git und Slotermeyer? Ja! Beiherhund das Oder die Flipperwaldt gersput!"
(Monty Python "Joke Warefare")
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 11:58 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz