Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Office 2003 OCR Engine benutzen (https://www.delphipraxis.net/71723-office-2003-ocr-engine-benutzen.html)

Brainshock 20. Jun 2006 08:52


Office 2003 OCR Engine benutzen
 
Hallo,

hat schon jemand das hier in Delphi umgesetzt und zum Laufen gebracht:

Link: Document Processing Part I: OCR with Microsoft® Office

Gruß,
Matthias

backdraft 26. Jun 2006 15:34

Re: Office 2003 OCR Engine benutzen
 
ne, aber ich fänds hätte auch interresse daran...

backdraft 28. Jun 2006 15:43

Re: Office 2003 OCR Engine benutzen
 
also ich habe alles fertig,

wenn interesse besteht, kann ich es ins forum posten.

Go2EITS 28. Jun 2006 15:55

Re: Office 2003 OCR Engine benutzen
 
Klasse!
Lass doch bitte Deine Arbeit mal sehen!

semo 28. Jun 2006 17:11

Re: Office 2003 OCR Engine benutzen
 
Zitat:

The page you requested cannot be found.
richtige url: http://www.codeproject.com/csharp/modi.asp

hat denn schon mal jemand mit gearbeitet bzw erste ferahrungen gesammelt?
bin da nämlich brennend dran interessiert, da wir überlegen die scansoft oder abby SDK zu erwerben....

backdraft 29. Jun 2006 20:40

Re: Office 2003 OCR Engine benutzen
 
also ich habe ein OCR Erkennung relativ weit mittlerweile fertig. Problematisch ist bei mir zur Zeit das Scannen von Teilausschnitten des Bildes.

Wichtig zu wissen, bevor ich euch die Sourcen poste ist, welche Delphi Version ihr benutzt.

Ich habe mit Delphi 7 angefangen. Dabei werden viele Funktionen der OCR Komponente nicht unterstützt.
Als ich auf Delphi 2006 umgestiegen bin, klappte alles wunderbar.

Ich kann eine Anleitung machen und ein kleines Demo Prog.
Was ich daraus auch wieder brauche ist ein Textdokument, welches genau die Spalten wieder erzeugt.
Ich denke, wenn ich diesen Source mitposte, könnte man gemeinsam das ganze realisieren.

Bei Interesse, dass ich die Delphi 2006 Sourcen postet, dann mache ich über das Wocheende was fertig.
Das Produkt was ich zur Zeit entwickele ist mit Datenbank anbindung, etc, also denke ich nicht so interessant.

Das ganze funktioniert eigentlich wunderbar mit dieser quasi kostenlosen OCR Erkennung. Wir haben uns zuerst überlegt die Schnittstelle von KADMOS (ca 1000 Euro pro Runtime) einzusetzen, wobei die MDIL um einiges besser funktioniert.

Grüße Oliver

semo 29. Jun 2006 20:48

Re: Office 2003 OCR Engine benutzen
 
klingt echt vielversprechend,
vor allem wenn man die preise für die abby und scansoft engine mit ca 5000 euro + lizenzgebühren bedenkt :thumb:

backdraft 29. Jun 2006 21:02

Re: Office 2003 OCR Engine benutzen
 
Liste der Anhänge anzeigen (Anzahl: 1)
Ok, wenn die Antwort so schnell kommt.
Ich hab das Programm mal eben gemacht.

Ziel der OCR ist bei mir, das ich ein Dokument raus bekomme, welches in Zeilen und Spalten wieder annähernd mit dem Original übereinstimmt. Dabei ist es egal, wie viele Leerzeichen zwischen den Spalten sind. Hauptsache, die Spalten stehen nachher wieder untereinander.

Da dass Ergebnis vom OCR Scan nur einen unformatierten Text liefert konnte ich diesen schonmal nicht nehmen, sondern musste jedes Wort einzeln neu auf meiner Matrix einsetzen.
Dazu habe ich erstmal die Pixel Positionen interpoliert. Ein "E" fängt anders an als ein "M" und kann so einen Verschub der X Position zur folge haben.

Das ganze Prog ist noch ziemlich Buggy und das Ergebnis eines Tages.

------------------------------------------------------------------------------

Um die nötigen Änderungen in Delphi 2006 vorzunehmen müssen folgende Schritte vorgenommen werden:
Komponenten -> Komponente importieren -> Active X -> Microsoft Document Image Library
Danach die MODI_TLB.pas in irgendein Package zufügen und schon stehen unter Active X die Sachen zur verfügung (so die Theorie)
Leider sind in der MODI_TLB auf einmal neue Definitionen von TImage, TImageProperties, etc.
Da das Package dann nicht kompiliert werden kann, habe ich die Komponenten in TMODIImage usw umbenannt.
Den Quelltext habe ich mal mit in den Source Ordner unter MODI gepackt, damit bei allen die hier helfen die Objekte gleich heissen.

So jetzt könnt ihr auch schon die Source Datei kompilieren.
Wichtig, das ganze ist für Delphi 2006. Ob es in Delphi 2005 geht weiss ich nicht. Delphi 7 geht halt nicht ordnungsgemäß.


Für Fragen schreibt mich direkt an unter oliver@oliver-ickler.de

Achso, fast vergessen. Die Optische Anzeige des Scans habe ich nur mit Delphi 7 hinbekommen. Vielleicht klappt es ja bei einem von euch.

Go2EITS 30. Jun 2006 04:47

Re: Office 2003 OCR Engine benutzen
 
@backdraft
Super, dass Du an dem OCR Projekt weiter arbeitest. :thumb:
Leider habe ich kein D2006. Ich lade es mir gerade bei Borland runter.
(ISDN, das kann dauern...)
Kannst Du vielleicht eine fertig compilierte Version beifügen?
Ich bin gespannt, wie es weiter geht.

Go2EITS

PeterRettig 20. Nov 2007 11:33

Re: Office 2003 OCR Engine benutzen
 
Hallo,

ich habe das auch mal versucht, habe aber ein kleines Problem
beim Aufruf des Befehles OCR.

Document1.OCR(miLANG_SYSDEFAULT,TRUE,TRUE);

Sobald ich einen der beiden letzten Parameter auf
true setze (automatisch drehen, automatisch glätten) bekomme
ich eine Exception "File is empty or corrupted".
Setze ich beide auf false funktioniert es, aber die
Erkennungsergebnisse lassen dann natürlich zu wünschen übrig.

Seltsamerweise kann ich das Programm (MS Document Imaging) problemlos
starten und dort auch das gleiche Dokument mit automatischem
Drehen und automatischem Glätten erkennen lassen.

Hat jemand eine Idee woran das liegen könnte?

Delphi 7
MS Office 2003 mit SP 3

Gruß, Peter.


Alle Zeitangaben in WEZ +1. Es ist jetzt 12:42 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz