Delphi-PRAXiS
Seite 1 von 2  1 2      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Algorithmen, Datenstrukturen und Klassendesign (https://www.delphipraxis.net/78-algorithmen-datenstrukturen-und-klassendesign/)
-   -   CSV-Datei mit /sb (https://www.delphipraxis.net/198000-csv-datei-mit-sb.html)

Harry Stahl 25. Sep 2018 18:18

CSV-Datei mit /sb
 
Habe eine csv-Datei von einem Kunden erhalten, wo ein hin und wieder vorkommendes "/sb" im Text (in dem freien Info-Feld) dazu führt, dass -per Stringlist.loadfromfile - an dieser Stelle ein Zeilenumbruch stattfindet.

Wenn ich die Datei in Notepad.exe öffne, findet der Umbruch nicht statt, die Datei hat 21609 Datensätze, mit Delphi Stringlist geöffnet sind es aber 27704 Datensätze.

Hat jemand eine Ahnung, warum das so ist und wie man es hinbekommt, dass auch die Stringlist nur 21609 Zeilen generiert?

Uwe Raabe 25. Sep 2018 18:36

AW: CSV-Datei mit /sb
 
Kannst du mal eine Beispieldatei und etwas Code zeigen, mit dem man das nachstellen kann?

Delphi.Narium 25. Sep 2018 18:40

AW: CSV-Datei mit /sb
 
Hilft das eventuell? : http://docwiki.embarcadero.com/Libra...trictDelimiter

Drecktrah 25. Sep 2018 19:00

AW: CSV-Datei mit /sb
 
"/sb" kommt vermutlich 27704 - 21609 = 6095 mal im Text vor?

Harry Stahl 25. Sep 2018 19:26

AW: CSV-Datei mit /sb
 
OK, habe da mal genauer mit einem Hex-Editor reingesehen. Nach /sb folgt "0A" (oder asci #10), was ja einen zeilenvorschub repräsentiert.

Die Stringlist macht nach dem einlesen (Stringlist.loadfromfile) aber da ein #13#10 draus.

/sb könnte ja für "soft break" stehen oder so.

Ist mir jedenfalls noch nicht untergekommen.

Mein Problem kann ich erst mal lösen, indem ich nach dem Einlesen der Datei z.B.

Delphi-Quellcode:
stringlist.text := ReplaceStr (stringlist.text, '/sb' + #13#10, ' ');


aufrufe, um die richtige Zeilenzahl zu bekommen.

(tatsächlich werde ich es nicht durch ein Leerzeichen ersetzen, sondern durch ein anderes Sonderzeichen, dass in meinen mehrzeiligen Feldern (Memo) den Zeilenumbruch repräsentiert).

Interessant finde ich aber, dass Windows Notepad so eine Zeile als eine Zeile einliest...

Nachtrag: Windows-Notepad ignoriert einfach #10 Zeichen und macht keinen neue Zeile auf, auch ohne /sb

Soweit ich das jetzt raus gefunden habe, wird in diesem Feld, das mehrzeiligen Text repräsentiert, das erste #10-Zeichen mit /sb eingeleitet, es können aber noch weitere #10 Zeichen (ohne /sb Einleitung) innerhalb des Textes für dieses Feld vorkommen.

Kann das irgendein Standard sein? Sehe ich jedenfalls zum ersten mal.

Suchen und ersetzen reicht da nicht, da muss ich das wohl als Memorystream einlesen und jedes einzelne #10 Zeichen, das nicht im Verbund mit #13#10 steht, eliminieren (bzw. durch mein eigenes Kennzeichen ersetzen)....

himitsu 25. Sep 2018 20:11

AW: CSV-Datei mit /sb
 
Zitat:

Zitat von Harry Stahl (Beitrag 1414161)
OK, habe da mal genauer mit einem Hex-Editor reingesehen. Nach /sb folgt "0A" (oder asci #10), was ja einen zeilenvorschub repräsentiert.

Gerade Notepad hat das Problem, dass es #10 nicht als Zeilenumbruch, sondern als Zeichen interpretiert.
Und da für #10 im Font nichts hinterlegt ist, hat das in der Anzeige eine Breite von 0, was du nur bemerkst, wenn du mit den Cursortasten zeichenweise durch den Text gehst.

p80286 26. Sep 2018 08:50

AW: CSV-Datei mit /sb
 
Wenn man mit csv-Dateien hantiert, ist "Zeile" ein untauglicher Begriff. en Datensatz wird durch x0D0A (#13#10) begrenzt, es sei denn diese Zeichenkombination befindet sich zwischen zwei " dann handelt es sich um ein (text)Feld das einen mehrzeiligen Text enthält.

Eine csv-Datei mit dem Notepad zu öffnen oder sie in eine Stringliste einzulesen, ist nicht in jedem fall zuverlässig und eignet sich allenfalls, um einen Überblick zu erhalten.

Gruß
K-H

U.U. kann man auch andere Vereinbarungen bezgl. der Feld und Satz-seperatoren treffen, aber das ist Vereinbarungssache.

Sherlock 26. Sep 2018 09:22

AW: CSV-Datei mit /sb
 
NotePad++ ist die bessere Lösung zur Fehlersuche in solchen Dateien. Da kann man sich die "Steuerzeichen" anzeigen lassen und sieht eigentlich sehr schnell was los ist.

Sherlock

jobo 26. Sep 2018 13:07

AW: CSV-Datei mit /sb
 
Was alles unter ".csv" so kursiert ist zwar nicht ganz zufällig, aber oft ist es nicht mal das Comma, aus Comma-Separated-Values, was man als Trenner findet.
[quote]..
As indicated by carriage return or linefeed characters, each line in the file is then appended in the list as a string.
..[quote]
http://docs.embarcadero.com/products...le@string.html

Auch da kann man sich über die Formulierung streiten, aber es wird jedenfalls beschrieben, das 2 verschiedene Zeichen als Delimiter des Zeilenendes akzeptiert werden.

Die Funktion tut also erstmal, was sie soll, oder?

Uwe Raabe 26. Sep 2018 13:39

AW: CSV-Datei mit /sb
 
Das ist hardcoded in
Delphi-Quellcode:
TStrings.SetTextStr
.

Delphi-Quellcode:
          while not (P^ in [#0, #10, #13]) do Inc(P);


Da die Methode aber virtuell ist, könntest du die überschreiben und durch einen für diesen Fall passenden Code ersetzen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:45 Uhr.
Seite 1 von 2  1 2      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz