Einzelnen Beitrag anzeigen

arnof

Registriert seit: 25. Apr 2013
1.250 Beiträge
 
Delphi 10.1 Berlin Enterprise
 
#11

AW: PDF Text lesen

  Alt 24. Apr 2014, 08:55
PDF ist ja nur ein Containerformat. Viele beinhalten statt Text aber nur Bilder der Seiten ( wenn eingescannt). In diesem Fall existiert dann kein Text, den Du so leicht auselesen kannst. Man müsste in diesem Fall einen Textindex (per OCR) erzeugen lassen (z.B. mit Vollversion von Adobe).
Diesen könnte man dann über den IFILTER auslesen. Dieser ist aber m.W. nicht mehr Teil des Readers.
Wenn es von einer OCR kommt oder manuelle erzeugt wurde, dann sollte es möglich sein das dort ein PDF (A-Format) ist, da sind die Texte für DMS Systeme lesbar drin.

Ich hätte mal gesagt schau doch mal in die Datei
  Mit Zitat antworten Zitat