AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

pdf, doc.. Volltextsuche

Ein Thema von API · begonnen am 20. Jan 2008 · letzter Beitrag vom 20. Jan 2008
Antwort Antwort
API

Registriert seit: 18. Apr 2004
637 Beiträge
 
#1

pdf, doc.. Volltextsuche

  Alt 20. Jan 2008, 10:15
Hallo

Ich suche eine Möglichkeit, Text aus einer pdf, xls, doc, ppt Datei zu extrahieren um
zu bestimmen, ob ein bestimmter Text dort vorhanden ist.
Dies soll für eine Volltextsuche werdet werden.

Gibt's hierfür eine einfache Methode?

Als z.b:
Delphi-Quellcode:
If SearchinPdf(PDFFilename,'Test') then
  ShowMessage('Text in PDF vorhanden');
Delphi-Quellcode:
If SearchinDoc(DOCFilename,'Test') then
  ShowMessage('Text in DOC vorhanden');
  Mit Zitat antworten Zitat
Benutzerbild von ULIK
ULIK

Registriert seit: 25. Sep 2006
Ort: Regensburg
416 Beiträge
 
Delphi 11 Alexandria
 
#2

Re: pdf, doc.. Volltextsuche

  Alt 20. Jan 2008, 10:50
Hallo,

was PDF betrifft: hier wirst Du nicht umhin können, ziemlich viel Geld in die Hände zu nehmen. Ohne kommerzielle Komponenten wird da nicht viel gehen, wenn Du nicht Lust/Zeit hast, Dich die nächsten Monate/Jahre in der PDF Spezifikation fit zu machen.
Selbst bei den kommerziellen Komponenten sollte man drauf achten, ob sie wirklich den Text sauber extrahieren können! Also testen mit den zu erwartenden PDFs!

Nur ein paar Komponenten:

PDFXChange SDK (setze ich in der Arbeit ein)
Foxit (da muß man wohl nachfragen, aber anscheinend sehr teuer)
Quickpdf
Adobe (wohl sehr teuer)

Wie gut die PDF Libs aus dem Java-Bereich sind, weiß ich nicht. Aber vieleicht könnte man da auch was machen.

Grüße,
Uli
  Mit Zitat antworten Zitat
Prototypjack

Registriert seit: 2. Feb 2003
611 Beiträge
 
Delphi 2009 Professional
 
#3

Re: pdf, doc.. Volltextsuche

  Alt 20. Jan 2008, 10:57
Moin,

Das gab's doch auch was auf dem Stammtisch, ich glaube sogar das war kostenlos. Einfach mal gucken, unter http://www.delphi-praxis.net/videos .

Grüße,
Max
Max
„If you have any great suggestions, feel free to mail me, and I'll probably feel free to ignore you.“ . Linus Torvalds
  Mit Zitat antworten Zitat
API

Registriert seit: 18. Apr 2004
637 Beiträge
 
#4

Re: pdf, doc.. Volltextsuche

  Alt 20. Jan 2008, 11:04
Danke für die Hinweise. Hab nun mit dem IFilter Interace Zugriff auf den Text erhalten. Scheint bei pdf, doc, xls usw. zu funktionieren. (Siehe http://www.shorterpath.com/develop/spfree/spfltrdr.asp)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:41 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz