AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Sonder-und Steuerzeichen

Ein Thema von wendelin · begonnen am 11. Mai 2017 · letzter Beitrag vom 13. Mai 2017
Antwort Antwort
wendelin

Registriert seit: 29. Dez 2010
Ort: Nürnberg
121 Beiträge
 
Delphi 7 Enterprise
 
#1

Sonder-und Steuerzeichen

  Alt 11. Mai 2017, 11:13
Hallo,

ich möchte mit Hilfe meines kleinen Programmes sog. PGN-Files einlesen (Schachpartien) und diese Schachpartien vorspielen.
Mit reinen Text-Dateien funktioniert alles vorzüglich. Nun habe ich aber PGN-dateien erhalten welche Sonderzeichen oder auch Steuerzeichen
enthalten. ( ChessBase - Datei) Diese kann ich jedoch nicht fehlerfrei einlesen.

Ich möchte nun von Euch wissen:

1. wie kann ich erkennen, ob die Datei UniCode (bzw. WideChar-Zeichen) enthält oder nur reinen ASCII-Text enthält?
2. wie kann ich sämtliche Sonderzeichen ,auch doppelte Zeilenumbrüche entfernen, so dass ich reinen ASCII-Text erhalte.

Ich habe schon mit TSysCharSet experimentiert und mit einer Func. 'StrKeepChars' aus der JCL. Komme aber damit nicht klar.
Im Anhang: 'Black-und White.pgn' -> Bad Files.
'Fisher.pgn' -> so sollte der Text-File aussehen !

Wendelin
Angehängte Dateien
Dateityp: zip Original databases.zip (1,01 MB, 8x aufgerufen)
Dateityp: zip Fischer.zip (153,7 KB, 5x aufgerufen)
Wolfgang
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#2

AW: Sonder-und Steuerzeichen

  Alt 11. Mai 2017, 11:29
Ich habe einen kurzen Blick auf die Dateien geworfen, und verstege dein Problem nicht.
In beiden Fällen scheint es sich um "ASCII"-Dateien zu handeln, bei denen nach der 80? Stelle der Text umgebrochen wurde. Außer CRLF scheinen alle Dateien keine Steuerzeichen zu enthalten.

Hast Du Dir die Dateien schon einmal mit einem Hex-Editor angeschaut?
Zitat:
1. wie kann ich erkennen, ob die Datei UniCode (bzw. WideChar-Zeichen) enthält oder nur reinen ASCII-Text enthält?
entweder wird ein 8Bit oder ein 16 Bit Zeichensatz verwendet (es gibt auch 32Bit-Zeichensätze}, das sollte eigentlich im Hex-Editor erkennbar sein (entweder x0020/x2000 oder x20 für ein Leerzeichen)
UTF8 ist ein 8BitZeichensatz, der durch "Escape Chars" zur Anzeige von Unicode-Zeichen ertüchtigt wurde.

Welches (Daten-)Format willst Du denn als Ausgabe erhalten?

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#3

AW: Sonder-und Steuerzeichen

  Alt 11. Mai 2017, 11:33
Sollte die Datei ein BOM haben, ist es recht einfach: http://docwiki.embarcadero.com/Libra...BufferEncoding
Ohne wird es wohl schwierig.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
nahpets
(Gast)

n/a Beiträge
 
#4

AW: Sonder-und Steuerzeichen

  Alt 11. Mai 2017, 11:43
Black und White haben am Anfang 'nen BOM  stehen.

Weiterer Unterschied:

In Fischer gibt es sowas: 1.d4

In Black und White sieht das (un)passende Gegenstück so aus: 1. d4

Grob erscheint mir das so:

In Black und White müssen die hinter einem Punkt befindlichen Leerzeichen entfernt werden.
  Mit Zitat antworten Zitat
wendelin

Registriert seit: 29. Dez 2010
Ort: Nürnberg
121 Beiträge
 
Delphi 7 Enterprise
 
#5

AW: Sonder-und Steuerzeichen

  Alt 11. Mai 2017, 22:30
Hallo Napets,

vielen Dank für Deinen Hinweis.
Diese Problem ist mir bei einigen anderen PGN-Files aus dem Netz auch schon aufgefallen.
Ich denke aber, daß es recht leicht zu beheben ist.
bezieht sich auf den zweiten Unterschied

Wendelin
Wolfgang

Geändert von wendelin (11. Mai 2017 um 22:42 Uhr)
  Mit Zitat antworten Zitat
wendelin

Registriert seit: 29. Dez 2010
Ort: Nürnberg
121 Beiträge
 
Delphi 7 Enterprise
 
#6

AW: Sonder-und Steuerzeichen

  Alt 12. Mai 2017, 22:13
Hallo,

problem gelöst. Habe einfach bei den Bad-Files mit Hexeditor die ersten 3 Zeichen (BOM) gelöscht.
danke
Wendelin
Wolfgang
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
43.142 Beiträge
 
Delphi 12 Athens
 
#7

AW: Sonder-und Steuerzeichen

  Alt 13. Mai 2017, 01:12
Eigentlich das nur ein Zeichen, wenn man es vorher richtig dekodiert hat.
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 00:37 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz