Apache Tika bindet intern ebenfalls Tesseract ein
Gibt es sowas fertig zum doppelklicken oder muss man sich das noch zusammenpuzzeln?
Apache Tika gibt es als Komandozeilenversion und als Rest-Server. Beides sind jar Archive, zum Ausführen brauchst Du dementsprechend JAVA. Bauen musst Du aber nichts sondern kannst es von
https://tika.apache.org/download.html downloaden. Die App / Komandozeilenversion ist unter [1] zu finden, der Reest Server unter [2]. Zum Spielen mit dem rest-server habe ich ein Datenmodul (
dfm und
pas) angehängt, nicht dokumentiert, nicht vollständig und server
url ist teilweise hartkodiert. Ist für Delphi 11 / Enterprise.
hth Ha-Joe
[1]
https://dlcdn.apache.org/tika/3.2.0/tika-app-3.2.0.jar
[2]
https://dlcdn.apache.org/tika/3.2.0/...dard-3.2.0.jar