Einzelnen Beitrag anzeigen

hanvas

Registriert seit: 28. Okt 2010
157 Beiträge
 
Delphi 11 Alexandria
 
#5

AW: Nicomsoft OCR /ICR/Barcode Reading SDK - jetzt Freeware

  Alt 29. Mär 2018, 11:00
[QUOTE=Mavarik;1397522]
Wie Du es einsetzt und wie gut es funktioniert?
Mavarik
Eigentlich würde auch ich Dir den Tip geben es Dir einfach mal anzusehen. Ich kann versuchen Dir eine Vergleich zwischen Nicomsoft und Tesseract zu geben, da ich beides recht gut kenne. Ein wenig kann ich auch mit Leadtools und Scansoft vergleichen, aber da habe ich mich nur oberflächlich in die Trial-Versionen eingearbeitet.

Ich verwende das SDK von Nicomsoft als dritte Engine (neben Tesseract und einer eigenen) zur Auswertung von Formularen und als einzige Engine zur Erzeugung durchsuchbarer PDF Dateien.

Das sind meines Wissens nach auch die einzigen beiden brauchbaren und bezahlbaren OCR Engines bei denen keine Laufzeitlizenzen notwendig sind.

Kennt man Tesseract und scheut den Aufwand nicht für eine definierte Situation eine möglichst ideale (für Tesseract) Vorlage zum Scannen zu schaffen dann erzielt man (seit V4 von Tesseract) möglicherweise bessere Ergebnisse, das lohnt sich aber meistens nur wenn immer gleiche oder ähnliche Dokumente bearbeitet werden (beispielsweise wenn immer das gleiche Formular ausgewertet werden soll)

Aber selbst dann ist die Engine von Nicomsoft oft die bessere Wahl, da einfacher. In allen Fällen in denen häufiger unterschiedliche Papiere gescannt ausgewertet werden soll hat die Nikomsoft-Engine ebenfalls eindeutig die Nase vorn. Die Nicomsoft-Engine liefert mit weniger Aufwand bessere Ergebnisse als Tesseract, auch wenn Tesseract in der Version 4 deutlich nachgezogen hat.

Die Barcode Erkennung der Engine ist wohl keine eigene Arbeit des Programierer sondern entsteht durch die Einbindung einer fremden Lib, wenn ich mich recht errinnere ZXIng. Das kann man zwar auch selbst einbinden, und beispielsweise Tesseract auf diese Art aufwerten, aber verwendet man das Nicomsoft SDK dann muss man nur eine API bedienen, die Barcode Erkennung ist transparent. (und funktioniert im übrigen besser als beispielsweise ZXIng für Delphi. [1]

Die Erkennung von handgeschriebenen Ziffern funktioniert erstaunlich gut, wenn der Schreiber etwas geübt ist und sauber schreibt. Bei den meisten anderen ICR Engines die ich kenne funktionieren deutsche Ziffern eher schlecht.

Zonale OCR

Ich habe ja schon geschrieben das ich hauptsächlich (unterschiedliche) Formulare damit auswerte. Das liegt daran das dass Nikomsoft SDK von Haus auf zonale OCR unterstützt. "Zonale OCR" ist nicht einfach nur das Lesen von Werten an einer bestimmten X/Y Position. Das wäre viel zu wenig (und lässt sich mit Tesseract auch erreichen) Die Positionen bestimmter Zonen sind nämlich auch bei gleichen Vorlagen nicht immer gleich.

Zu scannende Seiten werden unterschiedlich in den Scanner eingelegt/eingezogen, sind verknittert, nass und trocken geworden und vieles mehr. Mann kann natürlich mit Methoden der Bildverarbeitung (Bildregistrierung) dafür sorgen das ein gescanntes Bild an einer zuvor erstellten Referenz ausgerichtet wird, so mach ich das mittlerweile. Es gibt aber auch OCR Engines bei denen die Engine versucht entweder die definierten Zonen an das Bild anzupassen oder das Bild an die Zonen, in Grenzen macht das wohl auch die Engine von Nicomsoft.

Außerdem gibt es eine Reihe von Bildverarbeitungsoperationen die bei der Verarbeitung von Formularen hilfreich sind. Beispielsweise die Entfernung von Linien. Bei bestimmten Formularen sind oft Kasten eingezeichnet die als Begrenzung eines Feldes dienen. Die meisten Schreiber halten sich aber nicht wirklich an diese Begrenzungen und schreiben darüber. Deswegen mussen derartige Linien von der Erkennung entfernt werden, ohne das dabei die Schrift zerstört wird. Diese Operation wird durch das SDK angeboten.

Natürlich ist der Preis (0 €) unschlagbar, das war er aber auch schon als die Engine noch verkauft wurde (von ca. 400 € für eigene Projekte ohne Distribution bis zu ca. 1400 € mit unbegrenzter Weitergabe) verglichen mit beispielsweise Leadtools (3000 € - 5000 €, zzgl. Laufzeitlizenzen + Zusatzkosten für einzelne Module wie beispielsweise ICR) und der Umfang ist schon sehr beachtlich, auch oder gerade wegen der Auswertung von handgeschriebenen Ziffern.

Was fehlt ist die Auswertung von Ankreuzfeldern und andere Kleinigkeiten, aber arbeiten kann man damit definiv sehr gut.

cu Ha-Jö



[2] https://github.com/Spelt/ZXing.Delphi
  Mit Zitat antworten Zitat