Delphi-PRAXiS
Seite 2 von 4     12 34      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Sonstige Fragen zu Delphi (https://www.delphipraxis.net/19-sonstige-fragen-zu-delphi/)
-   -   32 Bit, TStringList, Textdatei mit 30Mio. Zeilen (https://www.delphipraxis.net/186612-32-bit-tstringlist-textdatei-mit-30mio-zeilen.html)

BUG 16. Sep 2015 16:08

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Da lässt sich noch viel machen :-D

Die Position der Zeilenanfänge kann man nach einem ersten Scan im Speicher halten, das wäre so um die 24 MiB. Dazu kann man einen Zeilen-Cache bauen, dass mit den Blöcken spricht ja für Lokalität im Algorithmus und die 1000 Zeilen kannst du leicht im Speicher halten.
Das Ganze hinter
Delphi-Quellcode:
TStrings
zu verstecken sollte dann nicht so schwer sein.

Luckie 16. Sep 2015 19:52

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Zitat:

Zitat von Bernhard Geyer (Beitrag 1315985)
Seit wann ist TStringList eine visuelle Komponente :gruebel:

Mist. Hatte die ganze Zeit Stringgrid im Kopf.

hoika 16. Sep 2015 20:23

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Hallo,
die Größe ist 500 MB, könnten aber auch 5 GB werden.
Das ist extrem alter Code, klar könnte ich was ändern,
aber warum, es gibt genügend andere Stellen ...


Heiko

Sir Rufo 16. Sep 2015 20:29

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Wenn du nur sequentiell durch die Zeilen gehst, wäre da ein
Delphi-Quellcode:
TEnumerable<string>
nicht ausreichend?

hoika 16. Sep 2015 20:38

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Hallo,
an einer Stelle wird leider StringList.Text verwendet -> Puff.
Ah ja, leider vergass ich, dass es sich hier (noch) um D2007 handelt,
also keine Generics.

Aber wie gesagt, es läuft.

Morgen kommen noch ein paar Unit-Tests dazu, dann zeig ich mal die neue Unit LargeStringList.pas ( ;) ).


Heiko

Dejan Vu 17. Sep 2015 06:40

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Das sieht man mal, wie praktisch es ist, nur gegen ein Interface zu programmieren (hier: Basisklasse).
Wenn die verwendete Implementierung dann nicht mehr ausreicht: Wupps! Ausgetauscht, läuft!

Sir Rufo 17. Sep 2015 06:58

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Zitat:

Zitat von hoika (Beitrag 1316026)
an einer Stelle wird leider StringList.Text verwendet -> Puff.

Aber dann wird dort ja der gesamte Text als Rückgabe erwartet, womit man wieder die gesamte Datei im Speicher hat ... es sei denn, man verbiegt die Bedeutung von Delphi-Referenz durchsuchenTStrings.Text und liefert dort nur einen Teil ...

Da würde ich eher auf eine andere Lösung setzen und eine Klasse erstellen, die so ähnlich wie
Delphi-Quellcode:
TStrings
arbeitet aber eben kein
Delphi-Quellcode:
TStrings
ist.

Ok, bevor wir meckern, warten wir auf die Vorstellung von
Delphi-Quellcode:
TLargeStringList = class( TStrings )
:)

OlafSt 17. Sep 2015 10:36

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Ganz ehrlich: Ich würde den bisherigen Importer eliminieren und das ganze neu (und vor allem sauber) implementieren. Als das damals gebaut wurde, waren 5MB vielleicht große Dateien. Solche Files kann man mit TStringList noch einigermaßen handeln, aber alles darüber wird zur Laufzeit-Qual. Heute sind 5GB große Files kein Thema mehr und in 8 Jahren sind es 5TB große Files. kommt deine LargeStringList damit auch klar, ohne vom Benutzer verlangen zu müssen, er soll n paar RAM-Riegel nachstecken ? :-D

Letztendlich versuchst du, denselben Unsinn (Datei komplett im Speicher) nur auf anderem Weg zu implementieren. Das wird vermutlich scheitern oder bestenfalls eine wenig effiziente Lösung werden. Besser, du investierst deine Zeit in eine Art Parser, der einmal durch die Datei durchgeht, in verschiedenen Listen sich merkt, in welchen Zeilen welcher Satz steht, die A-Sätze schon mal verarbeitet und im zweiten Lauf dann die anderen Sätze dazusortiert. Dann ist es auch fast egal, ob das File 5MB, 5GB oder 5PB groß ist.

Solche Umbau-Arien sind normal, wenn man alte bis sehr alte Projekte bearbeitet. Ich mach das seit Jahren und treffe immer wieder auf solche Stolperfallen.

p80286 17. Sep 2015 11:14

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
In "sehr alten" Projekten wird wahrscheinlich keine Stringlist eingesetzt, darum laufen die wohl immer noch:stupid:

Gruß
K-H

OlafSt 17. Sep 2015 12:56

AW: 32 Bit, TStringList, Textdatei mit 30Mio. Zeilen
 
Dann ist es aber wohl kein Delphi-Programm ;) TStringList gibt es schon seit D2 (weiter hatte ich keine Lust zu recherchieren). Ich denke eher, das in so einem "sehr alten" Projekt jemand saß, der etwas weiter als 2-3 Jahre gedacht hat ;)


Alle Zeitangaben in WEZ +1. Es ist jetzt 01:53 Uhr.
Seite 2 von 4     12 34      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz