Einzelnen Beitrag anzeigen

hoefi

Registriert seit: 20. Aug 2007
10 Beiträge
 
#1

Text aus durchsuchbarer PDF-Datei extrahieren

  Alt 31. Dez 2022, 13:39
Hallo,

ich habe mir einen Dokumentenscanner (SnapScan ix1600) gekauft und fange an, Dokumente ins PDF-Format zu scannen, um zukünftig das Papier zu entsorgen.
In Zukunft möchte ich dieses per Delphi-Programm unterstützen und möchte daher aus den durchsuchbaren PDF-Dateien die Texte extrahieren.
Das eigentliche Lesen der PDF-Dateien ist nicht unbedingt das Thema, allerdings finde ich keine Info darüber, wo (in welchem Object) in der PDF-Datei die Texte untergebracht sind.
Die Informationen sind per FlateDecode codiert, was ich eigentlich hinkriegen sollte.
Hat jemand sich schon mal erfolgreich dem Thema gewidmet?
Ich benötige nur die Texte.
  Mit Zitat antworten Zitat