Einzelnen Beitrag anzeigen

hanvas

Registriert seit: 28. Okt 2010
157 Beiträge
 
Delphi 11 Alexandria
 
#6

AW: OCR-Fähiger Screenshot

  Alt 26. Feb 2016, 09:12
Hallo zusammen,
Derzeit versuche ich mit per Komandozeile mit Tesseract auszuwerten.
Mit einem Schaltplaneditor habe ich ein paar Texte erstellt, dies dann als BMP exportiert und die Texte wurden einwandfrei ausgewertet.

Also kann es theoretisch nicht an Tesseract liegen...
Tesseract neigt dazu schlechte bis unbrauchbare Ergebnisse zu liefern wenn das Eingangsbild nicht so ist wie es für Tesseract sein sollte, du solltest in etwas

300 dpi
12 Punkt Schriftgröße

haben, weitere Sollgrößen werden auch unter https://github.com/tesseract-ocr/tes...ImproveQuality genannt.

Versuche dein Bild entsprechend zu skalieren. Tesseract bzw. die verwendete Library (Leptonica http://www.leptonica.com/) unterstützt 32Bit Farbbilder allerdings wird für die Texterkennung normalerweise ein intern daraus abgeleitetes Graustufenbild oder S/W Bild verwendet. Wenn die unterschiedlichen Farben dicht beieinander liegen und gleiche oder ähnliche Helligkeitswerte produzieren dann gehen bei der Wandlung ggf. Informationen verloren. Evtl. ist es eine gute Idee die Wandlung Farbe - Graustufen oder Farbe - SW selbst vorzunehmen, weil Du dann Einfluss auf das erzeugte Bild nehmen kannst und Konvertierungsfehler ausgleichen kannst.

Bevor Du dich an eine Implementierung mit Delphi ranmachst, kannst Du natürlich ein beliebiges Grafikprogramm nehmen und erst mal Deinen Screenshot damit Skalieren und anpassen um auf der Komandozeile auszuprobieren ob die Änderungen was bringen.

cu Ha-Jö
  Mit Zitat antworten Zitat