AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Text richtig einlesen

Ein Thema von stahli · begonnen am 18. Jun 2013 · letzter Beitrag vom 20. Jun 2013
Antwort Antwort
Seite 2 von 2     12   
musicman56
(Gast)

n/a Beiträge
 
#11

AW: Text richtig einlesen

  Alt 20. Jun 2013, 08:07
Hallo,

mich würde eine "automatisch" funktionierende Lösung auch interessieren. CharToOemBuff und OemToCharBuff setzen ja voraus, dass man erst mal wissen muss, in welcher Codierung die Datei bzw. der Text vorliegt. Sonst kommt Müll raus. Momentan löse ich das auf eine sehr umständliche Art und Weise (@Stahli das dürfte dein Problem auch lösen) aber ich denke/hoffe, dass es eine performantere Lösung gibt.

Delphi-Quellcode:
procedure AutoOemToChar(var Value: AnsiString);
var
  i: integer;
begin
  for i := 1 to Length(Value) do
  if ord(Value[i]) in [132,148,129,142,153,154,225,$FC,$FD]
  then if NOT CharInSet(Value[i],['ä','ö','ü','Ä','Ö','Ü','ß','³','²'])
  then begin
    OemToCharBuffA(PAnsiChar(Value), PAnsiChar(Value), Length(Value));
    Break;
  end;
end;
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#12

AW: Text richtig einlesen

  Alt 20. Jun 2013, 09:33
Es gibt keine automatische zu 100% funktionierende Erkennung.

Aufgrund dessen wurden ja BOM eingeführt, allerdings erst später (quasi zu spät) und verpflichtend sind die auch nicht.

Das gleich passiert, wenn du eine Excel-Datei mit der Endung .doc abspeicherst.
Ein Doppelklick auf diese Datei produziert nur noch Müll auf den Bildschirm.

Man muss wissen, um was es sich handelt um diesen Bytehaufen (mehr ist das nicht) richtig zu behandeln.

Für die einen ist es ein Keksriegel, für die anderen die längste Praline
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
Benutzerbild von stahli
stahli

Registriert seit: 26. Nov 2003
Ort: Halle/Saale
4.337 Beiträge
 
Delphi 11 Alexandria
 
#13

AW: Text richtig einlesen

  Alt 20. Jun 2013, 17:53
Ich habe es jetzt einfach zu Fuß gelöst.

Keine Ahnung ob sich klären lässt, welches Format hier vorliegt.
Ein kleines 'a' steht z.B. für 'ß'.

Wenn es später weitere unbekannte Sonderzeichen geben sollte würde ich informiert werden.
So kann ich auch gleich noch unseren Straßennamen-Sonderfall mit abfrühstücken.

Delphi-Quellcode:
    function StrassennamenKorrektur(S: string): string;
    var
      C: Char;
    begin
      Result := '';
      for C in S do
        case C of
          'A' .. 'Z', '-', '.', ' ':
            Result := Result + C;
          '1':
            Result := Result + ' EINS'; // Sonderfall Straßenname "Franckeplatz 1 Haus"
          #14:
            Result := Result + 'Ä';
          #25:
            Result := Result + 'Ö';
          #26:
            Result := Result + 'Ü';
          #97:
            Result := Result + 'ß'
        else
          begin
            Result := Result + C;
            ShowMessage('Zeichenwert #' + IntToStr(Ord(C)) + ' in Straßennamen ' + QuotedStr(S) + ' nicht eindeutig.');
          end;
        end;
    end;
Miniaturansicht angehängter Grafiken
ul.jpg  
Stahli
http://www.StahliSoft.de
---
"Jetzt muss ich seh´n, dass ich kein Denkfehler mach...!?" Dittsche (2004)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 00:22 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz