![]() |
Re: Ersetzen von Dezimalwerten
Moin Jan,
nein, Zeichen für Zeichen. Ist Deine Basis jetzt schon der extrahierte Text, oder noch die HTML Datei? |
Re: Ersetzen von Dezimalwerten
Hallo Christian,
ich habe bereits alles extrahiert was ich haben will, das einzige was halt noch stört sind die Sonderzeichen. Am besten mache ich das doch so, dass ich jedes Wort checke, ob es in einem Satz von Werten, die ich vorher deklariere enthalten ist, oder nicht? Gruß Jan |
Re: Ersetzen von Dezimalwerten
Moin Jan,
ich denke mal, Du könntest "einfach" Zeichen für Zeichen durchgehen. Ist es ein Zeichen <> &, wird es direkt in den Zielbuffer übernommen, ansonsten suchst Du Dir ab dieser Stelle alle Zeichen bis zum nächsten ; raus. Als Ergebnis für diesen Teilstring müsste jetzt (jeweils ohne Blank nach dem & versteht sich) & amp; / & lt; / & gt; / & quot; / & nbsp; oder & #nnn; rauskommen, da ja auch die Zeichen & / < / > / " und non breaking Space als Sonderzeichen kodiert sind (mehr als diese fünf fallen mir jetzt nicht ein). Den numerischen Wert könntest Du dabei einfach als chr(nnn) in den Zielbuffer schreiben, und die anderen durch eine Abfrage welcher String es ist, und dann das jeweilige Zeichen. Anschliessend steht der Quellindex hinter dem ; und das übersetzte Zeichen im Zielbuffer. Geht allemal schneller als ein wiederholtes StringReplace, was auch zu Übersetzungsfehlern führen kann, weil dann umgewandelte Zeichen wiederrum Umwandelbare Zeichenkombinationen bilden können, was je eindeutig falsch wäre. Du müsstest jetzt nur noch Fehler abfangen, denn es könnten ja auch Fehler in der Datei enthalten sein, z.B. ein einzelnes & was eigentlich als & amp; hätte enthalten sein müssen. |
Re: Ersetzen von Dezimalwerten
Hi Christian,
ich hab da mal was gebastelt, was auch funktioniert. Für die Nachwelt:
Delphi-Quellcode:
Ist das so in ordnung, oder kann man das noch irgendwie gewinnbringend optimieren?
function Specialchars(intext:string):string;
var i, p: integer; begin i:=1; while (not (i>length(intext))) do begin if intext[i]='&' then begin if intext[i+1]='#' then begin p:=pos(';', intext); if p<i+8 then intext:=copy(intext,1,i-1)+char(strtoint(copy(intext,i+2,p-(i+2))))+copy(intext,p+1,length(intext)-p); end; end; inc(i); end; result:=intext; end; Gruß Jan |
Re: Ersetzen von Dezimalwerten
Moin Jan,
ich würde mal behaupten, dass das unter Umständen schief geht. Wer sagt denn, dass ein ; nur als Kennzeichen für das Ende einer & #nnn; Darstellung dient? Noch gemeiner: Wenn der numerische Code = 59 ist, wird ein ; in den Text eingefügt, und schon stimmt das mit dem Pos auch nicht mehr. Initialisiere lieber Result auf einen String mit der Länge des Eingabestrings (z.B. auf Blank), und füge Zeichen für Zeichen dort ein. Triffst Du auf ein & im Quellstring, merk Dir dessen Position und suche nach dem nächsten ; Dann kannst Du den Wert dazwischen auswerten, und ins Ziel übertragen. Der Wert muss ja nicht zwingend numerisch sein & amp; könnte z.B. auch vorkommen, und müsste entsprechend übersetzt werden. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 05:30 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz