Einzelnen Beitrag anzeigen

MeierZwoo

Registriert seit: 3. Dez 2012
106 Beiträge
 
#4

AW: Text in PDF Tabelle suchen

  Alt 9. Mai 2013, 18:34
Das Grundproblem bei einer PDF ist, daß die Texte dort nicht in der Reihenfolge wie in der Ansicht folgen, und schon garnicht zeilenweise. Im Extremfall sind die einzelnen Wörter sogar in einzelne Zeichen mit Positionsangabe zerfleddert.

Um zum interpretieren des Inhalts die Zeilen in richtiger Anordnung und Folge wieder herzustellen, müssen auch alle Positionsangaben der Wörter oder Zeichen mitgelesen und das Ganze neu sortiert werden. Du kannst ja mal zur Anschauung mit dem Reader die Texte (in Datei) extrahieren lassen - dann siehst Du, was ich meine.

Und wenn die PDF binär erzeugt wurde (kein ASCII), wird das ein recht großer Aufwand für den erstrebten Zweck.

Und mit Pech wechseln zwischendurch die PDF-Versionen bzw. PDF-Writer/Treiber Versionen.

FF (Fiel Freude)
  Mit Zitat antworten Zitat