Delphi-PRAXiS
Seite 12 von 35   « Erste     2101112 131422     Letzte » 

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Software-Projekte der Mitglieder (https://www.delphipraxis.net/26-software-projekte-der-mitglieder/)
-   -   himXML (gesprochen himix ML) (https://www.delphipraxis.net/130751-himxml-gesprochen-himix-ml.html)

himitsu 7. Jul 2009 19:36

Re: himXML (gesprochen himix ML)
 
.XMLText:
Also in himXML wird der eingelesene/geparste Text ja in seine Einzelteile zerlegt und nur die enthaltenen Informationen gespeichert.
Beim "Auslesen" dieser Eigenschaft wird der XML-Text dann neu zusammengebaut.

Klar könnte ich jetzt noch alle möglichen Zusatzinfos über die ursprüngliche Textformatierung mit speichern, aber das wollte ich nicht ... ist mehr Aufwand, benötigt mehr Speicher und vorallem bremst es alles aus.

Das ist gerade ein Vorteil gegenüber dem MSXML-DOM ... die Geschwindigkeit und der Speicher

Und außerdem kommt es hier ja mehr auf den Inhalt und nicht das Datenformat an. :angel2:

XHTML ist ja "nur" ein Mischmasch aus HTML und XML,
aber wie gesagt, ich bin dabei einige "Restiktionen" zu lockern und "Umwege" einzubauen, aber alles werd' ich wohl nie hinbekommen, da ich vorwiegend nur Fehlererkennungen einbau und keine Fehlerbehebung (die Parser der großen Browsern könn ja nahezu jedes Problem gekonnt "ignorieren", was aber och blöd ist, da gerade deswegen viele Internetseiten eigentlich "defekt" sind, aber es läuft halt, drum läßt man es so)

himitsu 13. Jul 2009 15:35

Re: himXML (gesprochen himix ML)
 
Zitat:

Zitat von Daniel G
Hm... Aber Zahlen kann ich immer noch nicht als Knotenbezeichner benutzen, oder? :stupid:

wie ich grad bemerke ... gib für den Node einen Namespace an und schon ginge ex :mrgreen:

ich weiß allerdings grad nicht, ob der Name so auch noch der XML-Spec entspricht,
aber selbst wenn ich das ändern sollte ... ich leg grad eine neue Option an, wo man die Namensprüfung etwas lockern kann könnte.

z.B. "num:123" um es leicht wieder zu trennen oder es getrennt zu setzen, kannst du die Möglichkeiten für die Namespacebehandlung des Nodes nutzen (.Namespace und .NameOnly).

himitsu 14. Jul 2009 17:44

Re: himXML (gesprochen himix ML)
 
ich weiß, es gab 'ne Weile kein Update, aber nun geht's weiter

hier mal der aktuelle Stand (abgesehn von einigen Problemchen läuft es erstmal/wieder)
  • die Exceptions wurden alle fast komplett überarbeitet
    und liefern zusätzlich nun auch ein paar Infos mehr
    (z.B. den "falschen" Nodenamen, welcher bemängelt wurde)
  • die DLL-Version läuft auch (anscheinend)
    - der Memory Manager der EXE wird zur DLL durchgeshleift
    - die Klassen der DLL sind in der EXE verlinkt (die RTTI wird zur Laufzeit übertragen)
    - die Behandlung von Exceptions in der DLL wird an die EXE weitergereicht
  • die Pfade zu den Units werden jetzt nichtmehr in den Demos/Testprogrammen per IN-Statement angegeben, sondern über die Suchpfade
    - welche das sind (z.B. für ältere Delphi-Versionen) steht im Dateiheader
  • die globalen Kompilerschalter werden nicht mehr in der Interfaceunit (himXMLi.pas) angegeben
    dieses kann jetzt für jedes Projekt einzeln in den Projektoptionen angegeben werden
    (bei Wechsel des aktiven Projektes sollte das Projekt neu erzeigt werden, da Delphi bei Änderung der Optionen sonst vergißt die Units neu zu kompilieren :? )
    - Infos zu den möglichen Kompilerschaltern siehe Hilfe-Abschnitt in himXMLi.pas
  • der SAX-Parser und einige der neuen Klassen in den Tools sind noch nicht fertig
  • und die Interface-Version der DLL muß ich demnächst auch mal überarbeiten und versuchen die Fehler in der Referenzzählung zu finden


Datei siehe Post #1



Bezüglich einiger der Probleme der letzen 2 Seiten, wie z.B. die Kodierung usw.,
werd' ich mich jetzt erstmal damit etwas beschäftigen und versuchen alles nachzuvollziehen.

Falls einer 'ne Testdatei hat, wo etwas nicht läuft, könnte er sie mir ja gern mal zur Verfügung stellen.

himitsu 15. Jul 2009 10:11

Re: himXML (gesprochen himix ML)
 
hab grad die EXMLException überarbeitet

- ein netter Fehler in der Paremeterbehandlung in der Exceptionsklasse wurde behoben
('ne Exception in der Exception, welche den eigenentlichen Fehler verbarg)
- überlange Fehlertexte werden abgeschnitten (also hier z.B. eingeblendete Name)
- Steuer- und Unicodezeichen werden umgewandelt und Hexadezimal angezeigt

bei diesem
Delphi-Quellcode:
XML.Node['EDDH'].Node['2009'].Node['Juni'].Node['30'].Attribute['haha'] := 'Putzilein';
XML.Node['EDDH\2009\Juni\30'].Attribute['haha'] := 'Putzilein';
XML.Attribute['EDDH\2009\Juni\30\haha'] := 'Putzilein';
kommt also nun sowas raus (wenn NodeAutoCreate aktiviert ist)
Zitat:

---------------------------
Test
---------------------------
EXMLException (TXMLNodeList.Add):

invalid name ("2009")
---------------------------
OK
---------------------------
Wenn NodeAutoCreate nicht aktiv ist, dann würde Node[] ein nil zurückliefern,
darum hab ich mir grad überlegt noch eine weitere Option anzubieten, welche dann mit einer "Node existiert nicht"-Exception um sich wirft (dieses sollte dann die Zugriffsverletzung auf "nil" verständlicher machen) ... also beim nächsten Update vermutlich dann mit enthalten

himitsu 16. Jul 2009 08:20

Re: himXML (gesprochen himix ML)
 
aus Post #108
Zitat:

Zitat von Zwoetzen
Allerdings bin ich da schon auf einen nächsten Fehler gestoßen:

Test-Prozedur:
Delphi-Quellcode:
procedure TForm1.Button2Click(Sender: TObject);
const
  S: String = '<root>Some Text<child>Ding</child>Something else</root>'; // <-- Sollte gültiges XML sein
var
  XML: TXMLFile;
begin
  XML := TXMLFile.Create;
  try
    XML.asXML := S;
    ShowMessage(XML.RootNode.XMLText);
  finally
    XML.Free;
  end;
end;
Normalerweise würde man davon ausgehen, dass man nun als Ausgabe genau den Teil zwischen den <root>-Tags bekommt, allerdings erscheint:

Zitat:

Zitat von ShowMessage
Some Tex
<child>Ding</child>
Something els

Das bedeutet, dass sowohl das letzte Zeichen vor dem öffnenden <child> als auch vor dem schließenden </root> fehlt. Habe es mit verschiedenen Werten probiert, es scheint immer genau ein Zeichen zu fehlen.

da war ein kleiner "Trim"-Fehler in Bezug auf den Nodetyp xtUnknown, welcher in der Prozedur AssembleTree jeweil ein Zeichen zuviel entfernte :oops:

beim Einlesen war alles noch OK und auch wärend man mit dem Bäumchen arbeitete ... es verschand also nur wärend des Speicherns :angel2:

hab auch gleich mal die restlichen verbliebenen (langsameren) Suchschleifchen in ParsingTree ersetzt und ebefalls nach TXMLFile.ParsingTree._Search verlagert :stupid:

Update siehe Beta in Post #1

himitsu 17. Jul 2009 14:14

Re: himXML (gesprochen himix ML)
 
  • [add] die Exceptions hab ich auch noch etwas umgebaut
    - z.B. wird jetzt bei allen Exceptions wärend des Parsens die aktuelle Dateiposition angezeit
    - aber was Kodierungsfehler angeht ... da wird nur die etwaige Position genannt, also den Start der aktuellen Leseposition entsprechende des Lesepuffers (standardmäßig 32 KB).
    eine genauere Positionsangabe ist derzeit noch nicht vorgesehn (bissl aufwendig) ... kümmere mich da erstmal um andere Dinge
  • hab noch 'nen kleinen Fehler in ReadBOM behoben ... da wurden alle Vorgaben auf UTF-8 zurückgesetzt, wenn kein BOM gefunden wurde ... lso Vorgaben waren wirkungslos
  • die Interface-Verion läßt sich schonmal wieder kompilieren und sieht garnicht soooo schlecht aus ...
    nun muß ich nur noch irgenwann mal das mit der defekten Referenzzählung hinbekommen
  • dieses geht nun also
    Delphi-Quellcode:
    Var S: AnsiString;

    S := '<root>â</root>';
    XML.LoadFromXML(S, xeIso8859_1, False);

    XML.LoadFromXML('<root>â</root>', xeIso8859_1, False);

    // bzw. direkt für D2009 (sonst würde die UnicodeVersion aufgerufen
    // und Unicode nach ISO-8859 geht nicht mehr)
    XML.LoadFromXML(AnsiString('<root>â</root>'), xeIso8859_1, False);
  • wollte eigentlich noch dieses unterstützen,
    Delphi-Quellcode:
    XML.asXML[xeIso8859_1] := '<root>â</root>';
    aber leider klappt das mit den Vorgabewerten bei den Parametern nicht :cry:
    und man müßte immer eine Kodierung angeben.
    also hab ich's weggelassen und es ist da immer UTF8
  • die bisher freie Umschaltmöglichkeit der Kodierung wurde begrenzt und es kann nur noch umgeschaltet werden (via Prozessor-Style-Tag <?xml encoding="..."?> ), wenn der Zeichensatz mindestens eine gleich große Char-Size aufweist.

    also von Unicode nach UTF-8 umschalten geht nicht mehr
    - Grund dafür sind die Änderungen, welche einem nun erlauben das Encoding vorzugeben/abzuschalten
    und weshalb ich selber nicht mehr die volle Kontrolle über die Kodierung/Speicherbelegung hab.
    ein halbes Char in einem UnicodeString ist halt nicht möglich und darum mußte ich eine Sperre einbauen.
  • dann hab ich mir mal erlaubt die Dateiheader und settings aufzuräumen
  • da Delphi ja einige Probleme mit geänderten Compilerschaltern in den Projektoptionen hat:
    + mit der includen der himXMLCheck.inc, nach dem Usesabschnitt, kann nun im eigenen Projekt geprüft werden, ob die Units des himXML mit den selben Basisoptionen kompiliert wurden, wie das Projekt
    + in meinen Units wurde eine ähnliche "Selbstüberwachnung" ebenfalls integriert
    > es gibt dann eine Compilerwarnung, welche auffordert die Units neu zu compilieren

himitsu 18. Jul 2009 00:41

Re: himXML (gesprochen himix ML)
 
Ups, da gab's nen größeren Fehler in der Encodierung :oops:

Der reichte von falscher Decodierung, über fälschlicher Beschuldigung einer falschen Codierung, obwohl sie womöglich doch korrekt war,
über einen Pufferüberlauf, bzw. einer Exception, weil außerhalb des Puffers lesend zugegriffen wurde

Grund: der Lesepuffer wurde bei Änderung der Codierung (via <?xml-Tag) falsch geleert und der Zeiger nicht zurückgesetzt :?

Update siehe Post #1 > v0.94

holliesoft 18. Jul 2009 11:50

Re: himXML (gesprochen himix ML)
 
Liste der Anhänge anzeigen (Anzahl: 1)
Hi,

ich nutze seit einigen Wochen himXML für einen kleinen RSS Feedreader und habe mit der neuesten (Beta)Version vom 18.07. leider das Problem, dass beim Parsen einiger Feeds (u.a. bei der DP) ein Fehler auftritt.

Hier der Text von der himXML Exception:
Delphi-Quellcode:
EXMLException (TXMLFile.ParsingTree):
invalid closing tag - node #0022description#22 is not opened

error at byte position 389 ("</description>#0A   <image>#0A#09   <title>Delphi-PRAXiS</title>#0A#09   <url>http://www.delphipraxis.net/misc/banner/banner_dp_130_100.g..." on line 1)
Anbei die XML-Datei...

Gruß
Patrick

himitsu 18. Jul 2009 13:04

Re: himXML (gesprochen himix ML)
 
Liste der Anhänge anzeigen (Anzahl: 2)
Also hier kann ich mal beruhigt die Schuld dem bösen Daniel R. Wolf in die Schuhe schieben, :angel2:

denn die angehängte Datei ist nicht korrekt kodiert, bzw. enthält ungültige Zeichen.
z.B. das Markierte #$0F im Anhang Unbenannt.png .
Dieses Zeichen ist laut Spezifikation in XML-Dateien nicht als gültiges "Char" definiert.

Aber zum Glück hab ich für so'nen Fall schon vorsorglich vorgesorgt. :mrgreen:

Lösung:
laß "ungültige" Zeichen in ein Leerzeichen umwandeln
Delphi-Quellcode:
XML.Options := XML.Options + [xoChangeInvalidChars];
XML.LoadFromFile('..\Feed_1242DP.xml');
Und ich überleg mir grad, ob ich diese Option nicht gleich mit in die Standardoptionen aufnehmen soll? :gruebel:

himitsu 19. Jul 2009 18:35

Re: himXML (gesprochen himix ML)
 
eigentlich kaum erwähnenswert, aber da ich vorhin eine Nachricht bekam, daß etwas nicht mehr geht ...
  • die Interfaces werden jetzt wieder richtig "deaktiviert", wenn sie nicht benötigt werden, da einige Compiler (D2006 & D2007) nicht mit überladenen Defaultproperties in Interfaces klar kommen.
  • es wurden die Projektdateien für's "alte" BDS hinzugefügt (*.bdsproj & *.groupproj), damit auch diese Nutzer in den Demos die voreingestellten Suchpfade der Projektoptionen nutzen können.


Alle Zeitangaben in WEZ +1. Es ist jetzt 03:42 Uhr.
Seite 12 von 35   « Erste     2101112 131422     Letzte » 

Powered by vBulletin® Copyright ©2000 - 2022, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2021 by Daniel R. Wolf