Delphi-PRAXiS
Seite 3 von 3     123   

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Sonstige Fragen zu Delphi (https://www.delphipraxis.net/19-sonstige-fragen-zu-delphi/)
-   -   Delphi OCR für Delphi... (https://www.delphipraxis.net/79040-ocr-fuer-delphi.html)

mkinzler 22. Feb 2018 08:30

AW: OCR für Delphi...
 
Für Tesseract existiert auch eine Delphi-Wrapper

https://github.com/r1me/TTesseractOCR4

hanvas 22. Feb 2018 09:53

AW: OCR für Delphi...
 
Zitat:

Zitat von wschrabi (Beitrag 1394394)

Hab es zusammengebracht, doch leider kann ich von den WINDOWSSCREENshoot, das ich als BMP, JPG oder GIF habe, nur schlecht den Text wiedererkennen.... Hat wer da Rat wie man das verbessern kann.

Es kommt auch eine Warning:
Warning. Invalid resolution 0 dpi. Using 70 instead.

Es gibt eine FAQ zu Tesseract und was man machen kann um das Ergebnis zu verbessern.

https://github.com/tesseract-ocr/tes...ImproveQuality

In Deinem Fall vermutlich

1. Hast du die richtige Sprache installiert und verwendet, oder lediglich Default - also Englisch

Wenn nein, Deutsch verwenden ausprobieren, verbessert ?

Sprachen / Dictionaries kannst Du seperat herunterladen, auf die richtige Version achten

für Tesseract 3.X

https://github.com/tesseract-ocr/langdata

für Tesseract 4.X

https://github.com/tesseract-ocr/tessdata


2. Funktioniert evtl. Tesseract 4.X besser (mit Deutsch) ?

3. Kannst Du das Bild auf 300 DPI skalieren

4. Doch wieder selbst binariesieren. In Fall eines Screenshots ist normalerweise die einfachste Operation die beste. Wenn du jedes Pixel das heller ist als die Schriftfarbe (Schwarz) als weiß ansiehst, dann hast Du am Ende ein S/W Bild bei dem alles außer der schwarzen Schrift verschwunden ist. Das ist eigentlich ideal um es mit einer OCR zu verwenden.

hth

Ha-Jö


Alle Zeitangaben in WEZ +1. Es ist jetzt 12:41 Uhr.
Seite 3 von 3     123   

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz