AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Wort aus PDF auslesen

Ein Thema von oakley · begonnen am 9. Feb 2021 · letzter Beitrag vom 12. Feb 2021
Antwort Antwort
oakley

Registriert seit: 15. Aug 2005
287 Beiträge
 
#1

AW: Wort aus PDF auslesen

  Alt 11. Feb 2021, 15:55
Mit PDFIum vom Winsoft geht es.

PDF1.TextInRectangle(127.0,539.0,173.0,523.0) erzeugt ein Rechteck, in dem Text ausgelesen wird.
Bei Scans Muss ich nochmal schauen aber bei auslesbarem Text funktioniert es.

LG

Mirko
  Mit Zitat antworten Zitat
Delbor

Registriert seit: 8. Okt 2006
Ort: St.Gallen/Schweiz
1.196 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Wort aus PDF auslesen

  Alt 12. Feb 2021, 01:14
Hi oakley

Zitat:
Mit PDFIum vom Winsoft geht es.
Um zu scannen, benötigst du die Twain-Komponente(1) von kluug.net und die OCR-Komponente (2) von Winsoft.

(1) Zum Einscannen in ein Rasterbild (Bmp, Jpeg...)
(2) Zum Umwandeln des Grafiktextes in lesbares Textformat

Weitere Scanfähige Komponenten sind mir nicht bekannt.

Gruss
Delbor

PS:
Zitat:
Ich habe mir Winsoft PDF Suite mal angeschaut aber da ist mir nicht ganz klar, wie ich die Scanbereiche definieren kann.
Gescannt wird hier glaube ich immer das komplette Dokument.
Die PDF-Suite kann nicht scannen. Ausserdem: Es liegt in der Natur der Scanner-HardWare, dass immer nur eine Seite (oft A4) entweder Ein- odr Doppelseitig gescannt wird. Ein Dokument hingegen kann mehrere/viele Seiten enthalten - von einer bis (fast) beliebig vielen.




Die TWain
Roger
Man muss und kann nicht alles wissen - man muss nur wissen, wo es steht.
Frei nach Albert Einstein
http://roase.ch

Geändert von Delbor (12. Feb 2021 um 01:30 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 02:50 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz