![]() |
pdf, doc.. Volltextsuche
Hallo
Ich suche eine Möglichkeit, Text aus einer pdf, xls, doc, ppt Datei zu extrahieren um zu bestimmen, ob ein bestimmter Text dort vorhanden ist. Dies soll für eine Volltextsuche werdet werden. Gibt's hierfür eine einfache Methode? Als z.b:
Delphi-Quellcode:
If SearchinPdf(PDFFilename,'Test') then
ShowMessage('Text in PDF vorhanden');
Delphi-Quellcode:
If SearchinDoc(DOCFilename,'Test') then
ShowMessage('Text in DOC vorhanden'); |
Re: pdf, doc.. Volltextsuche
Hallo,
was PDF betrifft: hier wirst Du nicht umhin können, ziemlich viel Geld in die Hände zu nehmen. Ohne kommerzielle Komponenten wird da nicht viel gehen, wenn Du nicht Lust/Zeit hast, Dich die nächsten Monate/Jahre in der PDF Spezifikation fit zu machen. Selbst bei den kommerziellen Komponenten sollte man drauf achten, ob sie wirklich den Text sauber extrahieren können! Also testen mit den zu erwartenden PDFs! Nur ein paar Komponenten: PDFXChange SDK (setze ich in der Arbeit ein) Foxit (da muß man wohl nachfragen, aber anscheinend sehr teuer) Quickpdf Adobe (wohl sehr teuer) Wie gut die PDF Libs aus dem Java-Bereich sind, weiß ich nicht. Aber vieleicht könnte man da auch was machen. Grüße, Uli |
Re: pdf, doc.. Volltextsuche
Moin,
Das gab's doch auch was auf dem Stammtisch, ich glaube sogar das war kostenlos. Einfach mal gucken, unter ![]() Grüße, Max |
Re: pdf, doc.. Volltextsuche
Danke für die Hinweise. Hab nun mit dem IFilter Interace Zugriff auf den Text erhalten. Scheint bei pdf, doc, xls usw. zu funktionieren. (Siehe
![]() |
Alle Zeitangaben in WEZ +1. Es ist jetzt 03:04 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz