AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren

Tessearact mit Delphi

Ein Thema von Delbor · begonnen am 14. Mär 2018 · letzter Beitrag vom 15. Mär 2018
Antwort Antwort
Delbor

Registriert seit: 8. Okt 2006
Ort: St.Gallen/Schweiz
1.186 Beiträge
 
Delphi 11 Alexandria
 
#1

Tessearact mit Delphi

  Alt 14. Mär 2018, 13:19
Hi zusammen

Auf Grund dieses Threads habe ich mir den Delphi-Wrapper von da heruntergeladen.
Das Programm lässt sich jedoch nicht starten:

Zitat:
Im Projekt delphi_console_pdfconvert.exe ist eine Exception der Klasse Exception mit der Meldung 'Tesseract library is not loaded' aufgetreten.
Laut Code fehlt hier die libleptonica.dll:
Delphi-Quellcode:
 if (hLeptonicaLib = 0) then
  begin
    hLeptonicaLib := LoadLibrary({$IFDEF FPC}ExtractFilePath(ParamStr(0)) + libleptonica{$ELSE}PChar(libleptonica){$ENDIF});

Woher krieg ich das Ding?
Bzw., welche Dll wird für deutsch, englisch und eventuell französisch benötigt?

Ich hab mir einige Dlls heruntergeladen - insgesamt 1,1GB - soweit ich verstaden habe, eben verschiedene Sprachdateien. Die kamen dann aber mit einer Exe daher und haben sich hier installiert: C:\Program Files (x86)\Tesseract-OCR

Gruss
Delbor
Roger
Man muss und kann nicht alles wissen - man muss nur wissen, wo es steht.
Frei nach Albert Einstein
http://roase.ch
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.851 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Tessearact mit Delphi

  Alt 14. Mär 2018, 13:39
Folge doch einfach der README.
Dort ist ein Link mit einet ZIP mit all den benötigten Dlls.
Dort ist auch ein Link auf das Repository mit den Lerndateien für die verschiedenen Sprachen. Das Demo benötigt die englischen.
Markus Kinzler
  Mit Zitat antworten Zitat
Delbor

Registriert seit: 8. Okt 2006
Ort: St.Gallen/Schweiz
1.186 Beiträge
 
Delphi 11 Alexandria
 
#3

AW: Tessearact mit Delphi

  Alt 14. Mär 2018, 15:18
Hi mkinzler

Welcher Readme? Hier wimmelts nur so von diesen Dingern. Was ich da finde, sind ausser den Trainingsdateien für alle möglichen und unmöglichen Sprachen eine ganze Menge anderer Readme's, aber keine mit einem Hinweis auf die vermisste dll.
Und was ich hier gefunden habe, ist zwar der Sourcecode - nur nützt der mir rein gar nichts, da ich keinen C-Compiler habe.

Ich hab mir die Readme aus dem Beispielprogramm (TTesseractOCR4-master) mal mit Word geöffnet und versucht, den Text halbwegs anständig lesbar zu formatieren. Die einzigen Links, die ich gefunden habe, sind eben wie erwähnt solche zu Trainingsdateien oder zum Beispielprogrmm.

Gruss
Delbor
Roger
Man muss und kann nicht alles wissen - man muss nur wissen, wo es steht.
Frei nach Albert Einstein
http://roase.ch
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.851 Beiträge
 
Delphi 11 Alexandria
 
#4

AW: Tessearact mit Delphi

  Alt 14. Mär 2018, 16:17
Zitat:
Welcher Readme?
Zitat:
Clone this repository to a local folder.
Obtain Tesseract 4.x binaries. There are many sources to download binaries from, or ways to build them. I recommend using latest version, build from master branch of the project.
In Windows: there is no official installer. You can download precompiled binaries (Microsoft Visual C++ 2017 Redistributable x86 must be installed on the computer) and copy all DLL files to bin\. If you want to build Tesseract: compiling instructions (the easiest way is to use Visual Studio 2015/2017 and CPPAN).
Download trained language data files from tesseract-ocr/tessdata/ to bin\tessdata.
All examples in this repository require English data file (eng.traineddata).
Additionally examples\delphi-console-pdfconvert requires also osd.traineddata and pdf.ttf.
http://r1me.pl/tesseractocr-master.zip
https://github.com/tesseract-ocr/tessdata/
Markus Kinzler
  Mit Zitat antworten Zitat
Delbor

Registriert seit: 8. Okt 2006
Ort: St.Gallen/Schweiz
1.186 Beiträge
 
Delphi 11 Alexandria
 
#5

AW: Tessearact mit Delphi

  Alt 15. Mär 2018, 10:42
Hi mkinzler

Vielen Dank für den Tip. Irgendwie war es nicht sehr einfach, an der Stelle einen Link zu erkennen - die URL ging quasi in einer sehr ungewöhnlichen Orgie von runden und eckigen Klammern unter. Kommt dazu, dass Word eine URL nur als solche kennzeichnet (Blau), wenn sie mit einem Space beginnt und endet.

Im Moment öffnet sich bei einem Kompilierungsversuch die Konsole und schliesst gleich wieder - ich hab nicht mal die Zeit, eine Bilddatei auszuwählen. Mal sehen - hier gibts einen Thread mit genau dem gleichen Problem, zumindest, wenn ich mich recht erinnere.

Gruss
Delbor
Roger
Man muss und kann nicht alles wissen - man muss nur wissen, wo es steht.
Frei nach Albert Einstein
http://roase.ch
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.851 Beiträge
 
Delphi 11 Alexandria
 
#6

AW: Tessearact mit Delphi

  Alt 15. Mär 2018, 11:00
Die Dateinamen sind auch fest im Quellcode verankert

Delphi-Quellcode:
program delphi_console_pdfconvert;

{$APPTYPE CONSOLE}

{$R *.res}

uses
  tesseractocr in '..\..\tesseractocr.pas';

var
  inputFileName,
  outputFileName: String;
begin
  Tesseract := TTesseractOCR4.Create;
  try
    if Tesseract.Initialize('tessdata\', 'eng') then
    begin
      inputFileName := 'samples\multi-page.tif';
      outputFileName := 'multi-page.pdf';

      if Tesseract.CreatePDF(inputFileName, outputFileName) then
      begin
        WriteLn('PDF was saved succesfully to ' + outputFileName);
        ReadLn;
      end;
    end;
  finally
    Tesseract.Free;
  end;
end.
Markus Kinzler
  Mit Zitat antworten Zitat
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:09 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz