Ich hab das jetzt noch mal alles in die Tonne geworfen, neu runtergeladen, die verlinkte tesseract-ocr.exe aus deinem Post genommen, und schlußendlich hab ich es dann tatsächlich hinbekommen.
Möglicherweise habe ich, weil ich erst mit der TesseractOCR4 getestet habe, dann mit der TesseractOCR5, dann noch mal wieder zurück, mir irgendwo selbst ein Bein gestellt.
Soweit, so gut. An dieser Stelle erstmal: Vielen Dank für deine Hilfe.
Die Erkennungsqualität ist aber .... bescheiden. Ich hab das mal mit einem Eingescannten Fahrzeugschein getestet. Ein paar Sachen erkennt er mal, mal aber auch leider mit falschen Buchstaben, was natürlich nicht so prickelnd ist, will man sich ja auch die Daten verlassen können. Fahrgestellnummer ist mal richtig und mal falsch (Unterschiedliche Fahrzeugschein, je nach Qualität). Die Scans sind aber schon in guter Auflösung.
Wenn ich die gleichen Bilder in der Windows-Fotoanzeige öffnen, und dort gibt es ja auch eine OCR-Texterkennung, dann ist das Perfekt. Alles wird korrekt erkannt.
(Leider, zumindest nach meinem Wissensstand, gibt es für die OCR in der Windows-Fotoanzeige keine
API)
Ich kann das natürlich nicht mit einem Freeware OCR vergleichen, das ist schon klar.
Aber einen Vergleich mit kommerziellen OCR-Bibliotheken hab ich leider nicht.
Hast du du (oder jemand anderes) da noch irgendwelche Tipps, wie ich bei TesseractOCR noch etwas mehr rausholen könnte? (z.B. Idealauflösung, vielleicht irgendwie Schriftarten trainieren)
Ansonsten ist das schon recht cool, keine Rakete, aber cool.
Was ich noch nicht hinbekommen habe ist den Fortschritt über OnReconizeProgressEvent.