Einzelnen Beitrag anzeigen

Perlsau
(Gast)

n/a Beiträge
 
#9

AW: PDF Text lesen

  Alt 24. Apr 2014, 06:54
Gibt es denn so gar keine Möglichkeit den Text aus einer PDF zu lesen?
Vermutlich kann man das Kommandozeilen-Tool pdftotext via Delphi steuern und so aus PDF-Dateien, die garantiert Text enthalten, eine Textdatei generieren. Die Syntax meiner alten Version ist ganz einfach: pdftotext PdfDatei.pdf Textdatei.txt. Diverse parameter können zum Steuern wie z.B. der Angabe der ersten zu extrahierenden Seite oder dem Unterdrücken von Fehlermeldungen usw. eingesetzt werden. Funktioniert wie gesagt nur mit reinen Text-PDFs. Sobald Grafik oder undefinierbare Codes im PDF vorkommen, streikt das Tool.
  Mit Zitat antworten Zitat